چرا تصادفی کردن می‌بایست موجب اعتبار بالاتری برای شواهد باشد؟ تحلیلی از استدلال‌ها

رضا دانشور*

علوم انسانی پزشکیفلسفهفلسفه پزشکی کلاسیک

بوسیله تحریریه در مهر ۱۸, ۱۴۰۳

در مورد سلسله مراتب شواهد مطرح در EBM پرسش‌هایی مطرح است که می‌بایست با تحلیلی فلسفی به آنها بپردازیم و آنها را ایضاح کنیم. مشخصه اصلی این سلسله مراتب از این قرار است. در این سلسله مراتب کارآزمایی‌هایِ تصادفی به لحاظ شواهدی که ارائه می‌کنند مهم‌ترین نوع شواهد تلقی می‌شوند. RCT ها (و تلفیق‌های ناشی از آنها) برحسبِ ارزش اعتباری که فراهم می‌آورند در بالاترین مرتبه قرار گرفته و حتی نسبت مطالعۀ “مورد کنترلیِ” (Case- Control study) به دقت انجام شده دارای اعتبار برتری است، حتی اگر برای مثال مطالعۀ “مورد- کنترلی” نسبت به RCT ای بیماران بسیار بیشتری داشته باشد.

در حقیقت شیوۀ کاربردِ این سلسله مراتب ، صراحتاً مستلزم اینست که هر RCTای به طور خودکار بر هر مطالعه‌ای که مبتنی بر نوعی طراحی بدیل باشد ارجحیت دارد. به بیانِ مدافعانِ EBM “بهترین شواهد به منظور کاربرد در تصمیم‌ها، عبارتست از آن شواهدی که در سلسله مراتب در بالاترین مرتبه قرار دارند. شواهد از مرتبه‌ پایین‌تر را صرفاً هنگامی باید به کار برد که کارآزمایی کنترل شده تصادفیِ خوبی برای پاسخ به یک پرسشِ بالینیِ خاص وجود نداشته باشد.”

البته باید توجّه داشت که RCTهای کوچکِ ناکافی خودبخود برتر از هیچ مطالعۀ مشاهدتی متعارضی نیستند. اما اگر برای یک پرسشِ بالینی کارآزمایی‌های کنترلِ تصادفی با کیفیت بالا موجود باشند، آنها برتر از هر تعدادی از مطالعات مشاهدتی هستند. این امر احتمالاً در موردی که مطالعات مشاهدتی خودشان از کیفیت بالایی برخوردارند صادق است.

این سخن حتی در موردی که تعدادِ کل بیمارانِ دخیل در مطالعات مشاهدتی بزرگتر از تعداد بیماران دخیل در یک RCT واحد است نیز صادق است. پیروانِ EBM بدین باور هستند که برهان‌های محکمی بر برتریِ اعتبارِ معرفت‌شناختیِ عینیِ نتایجِ کارآزمایی تصادفی وجود دارد.

برهانی که فیشر بر مبنای منطق آزمون معناداری مطرح کرد.

فیشر ابداع‌کننده حقیقیِ کارآزمایی‌های بالینی است. برهان اولیه فیشر در مورد فرایندِ تصادفی نمودن این بود که آن برای تضمین بخشیدن به منطقِ آزمون‌های معناداری‌ای که خود مطرح نموده بود، ضروری است. تنها وقتی که با روش‌های تصادفی، آنهایی را که در گروه آزمودنی هستند و آنهایی که در گروه کنترل هستند جدا سازیم، در این صورت می‌توان روش‌شناسیِ آزمون‌ معناداری فیشر را به صورت سازگار و منسجم به کار برد.

حال این پرسش مطرح می‌شود که استدلال او برای تصادفی کردن به مثابۀ نوعی بنیادِ ضروری آن روش‌شناسی چگونه است. روش فیشر اساساً به صورت زیر است:

۱- “فرض صفر” (Null hypothesis) وضع می‌شود- این در حالت بالینی بیان‌کننده این است که درمانِ مورد بحث، در نتیجه مورد بررسی تأثیری ندارد. (یا این که درمان (مورد آزمون) در مقایسه با هر نوع معالجه گروهِ کنترل مؤثرتر نیست.)

۲- این فرض صفر به طور بی‌واسطه با “فرضیۀ شانس” یکی گرفته می‌شود: این امر بیان می‌کند که احتمال این که هر بیمارِ معینی نتیجه مورد پژوهش را نشان دهد (مثلاً بهبودی نشانه‌های معین) خواه درمان مورد آزمون را دریافت کند و یا درمان بدیل را یکسان است و این در نهایت متضمن توزیع احتمالاتی خاص برای تفاوتِ پاسخ‌های مثبت دو گروه است که در حول مقدار میانگین صفر متقارن است.

۳- بنابراین در یک آزمون یک دُمی (هنگامی که فرض می‌شود که حداقل ، درمانِ تحتِ آزمون موجب بدتر شدن امور نمی‌شود) مقدارِ تفاوتِ V به این صورت معین می‌شود که تنها ۵٪ شانس وجود دارد که چنین تفاوتی (یا بزرگتر از آن) مشاهده شود، به شرطی که فرضیۀ شانس در واقع صحیح باشد. مقادیرِ متشکل از V و بزرگتر از آن ناحیه معناداری نامیده می‌شوند.

۴- پس از آزمون، اگر نتیجه مشاهده شده در ناحیه معناداری واقع شود، آنگاه فرضِ صفر رد می‌شود و در واقع این فرضیه پذیرفته می‌شود که درمان مؤثر است.

برهانی که زیربنای روش‌شناسی فیشر را شکل می‌دهد نوعی برهان “امتناع معجزه” است.

روش‌شناسی فیشر متضمن این ادعا است که به شرط نادرست بودن فرضیه Hی (مثلاً این که در مقایسه با درمان متعارف درمان خاصی دارای اثراتِ مثبت دیگری است) اگر چیزی رخ دهد که بسیار نامحتمل باشد، آنگاه می‌بایست فرض کنیم که H در واقع نادرست نیست، بلکه درست است.

مطالب مرتبط

آسیب اخلاقی (Moral Injury) در نظام سلامت: نقدی بر اخلاق پزشکی…

مدلی برای دسته‌بندی حوزه‌ها و مسائل فلسفه پزشکی

همایش ملی فلسفه پزشکی؛ تلاشی برای پر کردن شکاف نهادی علوم انسانی…

البته همچنان که فیشر تشخیص می‌دهد این امکان وجود دارد که ما بدشانس باشیم، یعنی حتی گرچه فرض صفر را رد می‌کنیم، اما در عین حال این فرض درست باشد. در حقیقت در استفاده از یک ناحیه معنادار ۵٪ این انتظار می‌رود که ما به طور متوسط مرتکب خطای ۵٪ شویم. این امر دلیل احتیاط فیشر در مورد “پذیرش” (نتایج آزمون) است.

او متذکر می شود که قوت استنباطِ از نتیجۀ “معناداریِ آماری” به نادرستیِ فرضیه صفر، به طور منطقی موضوعی است که به یک ترکیب فصلیِ ساده مربوط می‌شود: یا این که واقعه نادری استثنائاً اتفاق افتاده است و یا این که فرضیه مربوط به توزیعِ تصادفی خاص (فرضیه شانس) درست نیست (و بنابراین ما باید فرضیه صفر را رد کرده و این فرضیه را بپذیریم که درمان مؤثر است).

در باب رویکردِ کلی فیشر بحث‌های بی‌پایانی رخ داده است. قائلان به رویکرد بیزی بر این باور هستند (و Worral نیز با آنها هم‌عقیده است) که به نظر می‌رسد برای طرحِ قواعد پذیرش و رد (فرضیه‌ها) دست یافتن به دلایلی خوب دشوار باشد و باید در این حیطه‌ای که بر آن احتمالات سیطره دارد، به احتمالات قانع باشیم. هر چیزی که شبیه نسخه قابل فهمی از “استدلال امتناع معجزه” باشد مستلزم فرض‌هایی در باب احتمالات پیشینی است. (که به تأثیر شواهد دخیلی به غیر از شواهد تحت بررسی اشاره دارد).

اما در اینجا آنچه که مورد توجه ما است دریافتن این نکته است که از نظر فیشر فرآیند تصادفیِ دخیل در آزمون چه نقشی در روش‌شناسی پیشنهادی او دارد و این که آیا استدلالی که او ارائه می‌کند در چارچوب اندیشه‌ خود فیشر متقاعدکننده است؟

برای این منظور باید به نکتۀ (۲) در طرح استدلالی فوق توجه کنیم: یعنی قبولِ اینهمانی فرضِ صفر (اینکه درمان مؤثر نیست) با فرض شانس (اینکه تفاوتِ نتایجِ مثبت دو گروه یک توزیعِ دو جمله‌ای در حولِ میانگینِ صفر است). این به معنای این است که فرضیۀ شانس همان فرضیه صفر است. اما این یک حکم وابسته به یک چارچوب مفهومی است.

استدلالِ امتناع معجزه فیشر مستلزم این مقدمه است که به فرض این که فرضیۀ H (این فرضیه که در مقایسه با گروه کنترل ، درمان دارای حداقل برخی از اثرات مثبت است) نادرست باشد برخی از رویدادهای رخ داده به غایت نامحتمل هستند.

اگر که با فرض نادرست بودن H رویدادی که رخ می‌دهد (رویدادی که اتفاق افتادنش مشروط به نادرست بودن H است) دارای احتمالِ بسیار پایینی باشد، در صدد این هستیم که بتوانیم H را استنباط کنیم. اما نفیِ H همچون نفی هر گزاره دقیقی موجبِ بیانِ یک ادعای بسیار ضعیفی است وبنابراین با امکان‌های خاص بیشتری سازگار است. ما قطعاً نمی‌توانیم بدون فرض‌های اضافی به سادگی نفی H را با هر فرضیه معینی (قاطعی) درباره شانسِ یک بیمار خاص در برخوردار بودن از پیامدهای مثبتی (در طی درمان) یکی بینگاریم. در کنار این احتمال که بهبودی مستقل از درمان است حالت‌های بدیل ممکن بسیاری وجود دارد که در آنها می‌تواند مؤثر نبودن درمان صدق کند.

فیشر از این امر آگاه بود و بنابراین دریافت که به منظور توجیهِ اینهمانیِ صرفِ این فرض که H نادرست است- یعنی درمان تأثیر ندارد- با هر فرض احتمالاتی معینی و نهایتاً‌ با فرض صفرِ مبنی بر این که تفاوت در نتایج مثبتِ دو گروه یک توزیعِ دوجمله‌ای در حول میانگین صفر است، به فرض دیگری نیاز هست.

فیشر خودش این فرض را در طیِ تشریح مثالی پیشنهاد نمود. اما آنچه که در این جا مورد توجه است منطقِ برهان اوست. فیشر دریافت که قبل از این که بتوان نفی فرضیه‌ای را با یک فرضیه احتمالاتی خاص اینهمان انگاشت، می‌بایست شرط دیگری نیز صدق کند. درست در این جاست که تصادفی کردن وارد می‌شود و به باورِ فیشر این فرض برای یافتن راه حلی برای این مشکل ضرورت دارد. او استدلال نمود که اینهمان دانستن نفی فرض H ( این که درمان تاثیری ندارد) با فرض صفرِ احتمالاتی (اینکه توزیع احتمالاتی نتیجه مثبت، میانگین صفر دارد) فقط و تنها فقط هنگامی مجاز است که طراحی آزمون با فرایندی تصادفی انجام شود. یعنی آزمون براساس داده‌های نمونه‌گیری تصادفی ناشی شده باشد. تنها این شرط است که تضمین خواهد نمود که تمامی ترکیباتِ امور مورد آزمون دارای شانس رخداد یکسانی هستند.

بنابراین فیشر ادعا نمود که اِعمال رویه‌های تصادفی و تخصیصِ تصادفی (اعضای گروه‌های آزمودنی و کنترل) متضمن این نکته است که اگر فرض H نادرست باشد، این احتمال که نتیجه آزمون این امر را رد کند بسیار اندک خواهد بود و بنابر تفسیر بسامدگرا ، از میان تعداد بسیارِ زیاد آزمون تنها تعداد اندکی این گونه خواهد بود.

این استدلال دارای جاذبه شهودی قوی ای است اما از دیدگاه بیزی‌ها این استدلال نمی‌تواند در برابر تدقیقِ انتقادی مقاومت کند.

با مثال‌هایی می‌توان نشان داد که تصادفی ساختنِ‌ فرآیند آزمون‌ها ما را از دغدغه درباب توضیحاتِ بدیل، بخصوص در باب توضیح‌های بدیلِ نتایج یک کارآزماییِ خاص و ارزیابیِ معقولیت اینها در پرتو معرفتِ پس‌زمینه‌ای رهایی نمی‌بخشد.

نتیجه بلافصل این امر این است که استدلالِ فیشر برای تصادفی کردن- یعنی این که این فرآیند برای تضمین اعتبار آزمون معناداری او لازم است- حتی بر حسب چهارچوب خود او شکست می‌خورد.

رضا دانشور، دانش آموخته دکترای فلسفه علم و تکنولوژی، پژوهشگاه علوم انسانی و مطالعات فرهنگی