چرا تصادفی کردن میبایست موجب اعتبار بالاتری برای شواهد باشد؟ تحلیلی از استدلالها
رضا دانشور*
در مورد سلسله مراتب شواهد مطرح در EBM پرسشهایی مطرح است که میبایست با تحلیلی فلسفی به آنها بپردازیم و آنها را ایضاح کنیم. مشخصه اصلی این سلسله مراتب از این قرار است. در این سلسله مراتب کارآزماییهایِ تصادفی به لحاظ شواهدی که ارائه میکنند مهمترین نوع شواهد تلقی میشوند. RCT ها (و تلفیقهای ناشی از آنها) برحسبِ ارزش اعتباری که فراهم میآورند در بالاترین مرتبه قرار گرفته و حتی نسبت مطالعۀ “مورد کنترلیِ” (Case- Control study) به دقت انجام شده دارای اعتبار برتری است، حتی اگر برای مثال مطالعۀ “مورد- کنترلی” نسبت به RCT ای بیماران بسیار بیشتری داشته باشد.
در حقیقت شیوۀ کاربردِ این سلسله مراتب ، صراحتاً مستلزم اینست که هر RCTای به طور خودکار بر هر مطالعهای که مبتنی بر نوعی طراحی بدیل باشد ارجحیت دارد. به بیانِ مدافعانِ EBM “بهترین شواهد به منظور کاربرد در تصمیمها، عبارتست از آن شواهدی که در سلسله مراتب در بالاترین مرتبه قرار دارند. شواهد از مرتبه پایینتر را صرفاً هنگامی باید به کار برد که کارآزمایی کنترل شده تصادفیِ خوبی برای پاسخ به یک پرسشِ بالینیِ خاص وجود نداشته باشد.”
البته باید توجّه داشت که RCTهای کوچکِ ناکافی خودبخود برتر از هیچ مطالعۀ مشاهدتی متعارضی نیستند. اما اگر برای یک پرسشِ بالینی کارآزماییهای کنترلِ تصادفی با کیفیت بالا موجود باشند، آنها برتر از هر تعدادی از مطالعات مشاهدتی هستند. این امر احتمالاً در موردی که مطالعات مشاهدتی خودشان از کیفیت بالایی برخوردارند صادق است.
این سخن حتی در موردی که تعدادِ کل بیمارانِ دخیل در مطالعات مشاهدتی بزرگتر از تعداد بیماران دخیل در یک RCT واحد است نیز صادق است. پیروانِ EBM بدین باور هستند که برهانهای محکمی بر برتریِ اعتبارِ معرفتشناختیِ عینیِ نتایجِ کارآزمایی تصادفی وجود دارد.
برهانی که فیشر بر مبنای منطق آزمون معناداری مطرح کرد.
فیشر ابداعکننده حقیقیِ کارآزماییهای بالینی است. برهان اولیه فیشر در مورد فرایندِ تصادفی نمودن این بود که آن برای تضمین بخشیدن به منطقِ آزمونهای معناداریای که خود مطرح نموده بود، ضروری است. تنها وقتی که با روشهای تصادفی، آنهایی را که در گروه آزمودنی هستند و آنهایی که در گروه کنترل هستند جدا سازیم، در این صورت میتوان روششناسیِ آزمون معناداری فیشر را به صورت سازگار و منسجم به کار برد.
حال این پرسش مطرح میشود که استدلال او برای تصادفی کردن به مثابۀ نوعی بنیادِ ضروری آن روششناسی چگونه است. روش فیشر اساساً به صورت زیر است:
۱- “فرض صفر” (Null hypothesis) وضع میشود- این در حالت بالینی بیانکننده این است که درمانِ مورد بحث، در نتیجه مورد بررسی تأثیری ندارد. (یا این که درمان (مورد آزمون) در مقایسه با هر نوع معالجه گروهِ کنترل مؤثرتر نیست.)
۲- این فرض صفر به طور بیواسطه با “فرضیۀ شانس” یکی گرفته میشود: این امر بیان میکند که احتمال این که هر بیمارِ معینی نتیجه مورد پژوهش را نشان دهد (مثلاً بهبودی نشانههای معین) خواه درمان مورد آزمون را دریافت کند و یا درمان بدیل را یکسان است و این در نهایت متضمن توزیع احتمالاتی خاص برای تفاوتِ پاسخهای مثبت دو گروه است که در حول مقدار میانگین صفر متقارن است.
۳- بنابراین در یک آزمون یک دُمی (هنگامی که فرض میشود که حداقل ، درمانِ تحتِ آزمون موجب بدتر شدن امور نمیشود) مقدارِ تفاوتِ V به این صورت معین میشود که تنها ۵٪ شانس وجود دارد که چنین تفاوتی (یا بزرگتر از آن) مشاهده شود، به شرطی که فرضیۀ شانس در واقع صحیح باشد. مقادیرِ متشکل از V و بزرگتر از آن ناحیه معناداری نامیده میشوند.
۴- پس از آزمون، اگر نتیجه مشاهده شده در ناحیه معناداری واقع شود، آنگاه فرضِ صفر رد میشود و در واقع این فرضیه پذیرفته میشود که درمان مؤثر است.
برهانی که زیربنای روششناسی فیشر را شکل میدهد نوعی برهان “امتناع معجزه” است.
روششناسی فیشر متضمن این ادعا است که به شرط نادرست بودن فرضیه Hی (مثلاً این که در مقایسه با درمان متعارف درمان خاصی دارای اثراتِ مثبت دیگری است) اگر چیزی رخ دهد که بسیار نامحتمل باشد، آنگاه میبایست فرض کنیم که H در واقع نادرست نیست، بلکه درست است.
البته همچنان که فیشر تشخیص میدهد این امکان وجود دارد که ما بدشانس باشیم، یعنی حتی گرچه فرض صفر را رد میکنیم، اما در عین حال این فرض درست باشد. در حقیقت در استفاده از یک ناحیه معنادار ۵٪ این انتظار میرود که ما به طور متوسط مرتکب خطای ۵٪ شویم. این امر دلیل احتیاط فیشر در مورد “پذیرش” (نتایج آزمون) است.
او متذکر می شود که قوت استنباطِ از نتیجۀ “معناداریِ آماری” به نادرستیِ فرضیه صفر، به طور منطقی موضوعی است که به یک ترکیب فصلیِ ساده مربوط میشود: یا این که واقعه نادری استثنائاً اتفاق افتاده است و یا این که فرضیه مربوط به توزیعِ تصادفی خاص (فرضیه شانس) درست نیست (و بنابراین ما باید فرضیه صفر را رد کرده و این فرضیه را بپذیریم که درمان مؤثر است).
در باب رویکردِ کلی فیشر بحثهای بیپایانی رخ داده است. قائلان به رویکرد بیزی بر این باور هستند (و Worral نیز با آنها همعقیده است) که به نظر میرسد برای طرحِ قواعد پذیرش و رد (فرضیهها) دست یافتن به دلایلی خوب دشوار باشد و باید در این حیطهای که بر آن احتمالات سیطره دارد، به احتمالات قانع باشیم. هر چیزی که شبیه نسخه قابل فهمی از “استدلال امتناع معجزه” باشد مستلزم فرضهایی در باب احتمالات پیشینی است. (که به تأثیر شواهد دخیلی به غیر از شواهد تحت بررسی اشاره دارد).
اما در اینجا آنچه که مورد توجه ما است دریافتن این نکته است که از نظر فیشر فرآیند تصادفیِ دخیل در آزمون چه نقشی در روششناسی پیشنهادی او دارد و این که آیا استدلالی که او ارائه میکند در چارچوب اندیشه خود فیشر متقاعدکننده است؟
برای این منظور باید به نکتۀ (۲) در طرح استدلالی فوق توجه کنیم: یعنی قبولِ اینهمانی فرضِ صفر (اینکه درمان مؤثر نیست) با فرض شانس (اینکه تفاوتِ نتایجِ مثبت دو گروه یک توزیعِ دو جملهای در حولِ میانگینِ صفر است). این به معنای این است که فرضیۀ شانس همان فرضیه صفر است. اما این یک حکم وابسته به یک چارچوب مفهومی است.
استدلالِ امتناع معجزه فیشر مستلزم این مقدمه است که به فرض این که فرضیۀ H (این فرضیه که در مقایسه با گروه کنترل ، درمان دارای حداقل برخی از اثرات مثبت است) نادرست باشد برخی از رویدادهای رخ داده به غایت نامحتمل هستند.
اگر که با فرض نادرست بودن H رویدادی که رخ میدهد (رویدادی که اتفاق افتادنش مشروط به نادرست بودن H است) دارای احتمالِ بسیار پایینی باشد، در صدد این هستیم که بتوانیم H را استنباط کنیم. اما نفیِ H همچون نفی هر گزاره دقیقی موجبِ بیانِ یک ادعای بسیار ضعیفی است وبنابراین با امکانهای خاص بیشتری سازگار است. ما قطعاً نمیتوانیم بدون فرضهای اضافی به سادگی نفی H را با هر فرضیه معینی (قاطعی) درباره شانسِ یک بیمار خاص در برخوردار بودن از پیامدهای مثبتی (در طی درمان) یکی بینگاریم. در کنار این احتمال که بهبودی مستقل از درمان است حالتهای بدیل ممکن بسیاری وجود دارد که در آنها میتواند مؤثر نبودن درمان صدق کند.
فیشر از این امر آگاه بود و بنابراین دریافت که به منظور توجیهِ اینهمانیِ صرفِ این فرض که H نادرست است- یعنی درمان تأثیر ندارد- با هر فرض احتمالاتی معینی و نهایتاً با فرض صفرِ مبنی بر این که تفاوت در نتایج مثبتِ دو گروه یک توزیعِ دوجملهای در حول میانگین صفر است، به فرض دیگری نیاز هست.
فیشر خودش این فرض را در طیِ تشریح مثالی پیشنهاد نمود. اما آنچه که در این جا مورد توجه است منطقِ برهان اوست. فیشر دریافت که قبل از این که بتوان نفی فرضیهای را با یک فرضیه احتمالاتی خاص اینهمان انگاشت، میبایست شرط دیگری نیز صدق کند. درست در این جاست که تصادفی کردن وارد میشود و به باورِ فیشر این فرض برای یافتن راه حلی برای این مشکل ضرورت دارد. او استدلال نمود که اینهمان دانستن نفی فرض H ( این که درمان تاثیری ندارد) با فرض صفرِ احتمالاتی (اینکه توزیع احتمالاتی نتیجه مثبت، میانگین صفر دارد) فقط و تنها فقط هنگامی مجاز است که طراحی آزمون با فرایندی تصادفی انجام شود. یعنی آزمون براساس دادههای نمونهگیری تصادفی ناشی شده باشد. تنها این شرط است که تضمین خواهد نمود که تمامی ترکیباتِ امور مورد آزمون دارای شانس رخداد یکسانی هستند.
بنابراین فیشر ادعا نمود که اِعمال رویههای تصادفی و تخصیصِ تصادفی (اعضای گروههای آزمودنی و کنترل) متضمن این نکته است که اگر فرض H نادرست باشد، این احتمال که نتیجه آزمون این امر را رد کند بسیار اندک خواهد بود و بنابر تفسیر بسامدگرا ، از میان تعداد بسیارِ زیاد آزمون تنها تعداد اندکی این گونه خواهد بود.
این استدلال دارای جاذبه شهودی قوی ای است اما از دیدگاه بیزیها این استدلال نمیتواند در برابر تدقیقِ انتقادی مقاومت کند.
با مثالهایی میتوان نشان داد که تصادفی ساختنِ فرآیند آزمونها ما را از دغدغه درباب توضیحاتِ بدیل، بخصوص در باب توضیحهای بدیلِ نتایج یک کارآزماییِ خاص و ارزیابیِ معقولیت اینها در پرتو معرفتِ پسزمینهای رهایی نمیبخشد.
نتیجه بلافصل این امر این است که استدلالِ فیشر برای تصادفی کردن- یعنی این که این فرآیند برای تضمین اعتبار آزمون معناداری او لازم است- حتی بر حسب چهارچوب خود او شکست میخورد.
رضا دانشور، دانش آموخته دکترای فلسفه علم و تکنولوژی، پژوهشگاه علوم انسانی و مطالعات فرهنگی