بحران تکرارپذیری (۱)

هادی صمدی

علوم انسانی پزشکیعلوم زیست پزشکیفلسفه پزشکی کلاسیک

بوسیله تحریریه در شهریور ۸, ۱۴۰۱

مقدمه: بحران تکرارپذیری چیست؟

از زمان شیوع بیماری کرونا به دفعات شاهد آن بودیم که شواهدی عرضه شده است مبنی بر اینکه داروی الف (یا شیوه‌ی درمانی الف) در کاهش علائم بیماری یا درمان آن مؤثر است. اما با گذشت تنها چند روز شواهد دیگری عرضه شده‌اند مبنی بر نادرستی شواهد نخست. اگر بپذیریم که پارادایم رایج در پزشکی امروز، پارادایمی است معروف به «پزشکی مبتنی بر شواهد» پرسش این خواهد بود که چه هنگامی موجه خواهیم بود که شواهد له یا علیه یک نظریه (مثلا اینکه داروی الف علائم کرونا را تخفیف می‌دهد) را در پزشکی مبنای اقدامات درمانی قرار دهیم. ساده‌ترین پاسخ به این پرسش آن است: «هر گاه شواهد محصول روش‌های پژوهش موثق و مبتنی بر آمار باشند». پیش‌فرض این پاسخ آن است که اگر شواهد محصول روش‌های پژوهش موثق مبتنی بر آمار باشند در تکرارهایِ بعدیِ همان پژوهش، کمابیش همان نتایج را خواهیم داشت و بنابراین به نحوی مشابه بیماران را نیز، همانند گروه مورد آزمایش، درمان خواهند شد. اگر این شواهد فرضیه‌ی مورد آزمون را در گام نخست قبول یا رد کرده باشند انتظار بر آن ‌است که در گام بعدی نیز چنین کنند. در گفتار حاضر ابتدا نشان خواهیم داد پیش‌فرض ظاهراً مقبول ذکرشده با چالش‌های زیادی مواجه شده است؛ چالشی که در سال ۲۰۱۲ «بحران تکرارپذیری» نام گرفت. در گام دوم به علل این بحران می‌پردازیم و در انتها به راههای برون رفت از آن اشاره خواهیم کرد.

به طور سنتی فیلسوفان زیادی، به ویژه در سنت قاره‌ای، بوده‌اند که شأن ممتازی را که علم در جهان امروز دارد به چالش کشیده‌اند (به عنوان نمونه هیدگر را ببینید که با فهم پوزیتویستی رایج در زمان خود ازعلم مخالف بود). فیلسوفانی نیز در سنت تحلیلی بوده‌‌اند که خنثی بودن مشاهدات را به پرسش گرفتند و اعلام کردند که همه‌ی مشاهدات وابسته‌اند به نظریه‌ها و پیش‌فرض‌های نظری مشاهده‌گر. فیلسوفان دیگری از همین سنت نیز عینیت آزمایش را به پرسش گرفته‌اند. اما این‌بار تفاوت در آنجا بود که چالش از سوی خود دانشمندان پیشِ رو ‌نهاده شده بود و در واقع برخی یافته‌های تجربی گواهی بودند بر اینکه عموم داده‌هایی که گمان داشتیم موثق‌اند چندان هم موثق نبوده‌اند.

مطابق فهم عرفی دانشمندان وقتی یک فرضیه آماری در سطح آلفای پنج‌صدم به چاپ می‌رسد به معنای آن است که اگر ۱۰۰ بار آزمایش یاد شده تکرار شود انتظار آن است که درحدود ۹۵ بار همان نتایج قبلی بدست آید. (در ادامه خواهیم دید که یک فیلسوف علم، الکساندر برد، این فهم عرفی را به چالش کشیده است.) اما تکرار آزمایش‌های یاد شده در این مقالاتِ نشریافته نتایج کاملاً متفاوتی را نشان می‌داد. در یکی از پژوهش‌ها که در ادامه معرفی می‌شود نشان داده شد که ۶۵ درصد مقالات نتیجه‌ای متفاوت از پژوهش چاپ شده داشتند. ۶۵ درصد به میزان قابل توجهی از عدد مورد انتظار، یعنی پنج درصد بیشتر است. پرسش این بود که به چه میزان می‌توان به یافته‌های علمی موجود در نشریات معتبر اعتماد کرد؟ پرسش دیگر اینکه علل بوجود آمدن این بحران کدامند؟ در ادامه تلاش می‌شود دلایل اصلی بحران معرفی شوند اما قبل از آن اشاره‌ی مختصر به نحوه‌ی آشکار شدن بحران خواهیم داشت.

آگاهی از وجود بحران

تجربه‌ی مشترکی میان عموم دانشجویان رشته‌هایی که دروس آزمایشگاهی داشته‌اند وجود دارد: اینکه بارها تمامی دستورالعمل‌های توصیه شده برای به ثمر رسیدن یک آزمایش را رعایت کرده‌اند اما به نتیجه‌ی مطلوب نرسیده‌اند. تا بیست سال پیش کمتر کسی گمان آن داشت که این تجربه به بحرانی در علم بیانجامد. سال ۲۰۰۵ مقاله‌ای توسط یوانیدِس، پژوهشگر علوم پزشکی به چاپ رسید با این عنوان که «چرا عمده‌ی یافته‌های پژوهشی چاپ شده نادرست‌اند». این‌بار نه دانشجویان کم‌تجربه، بلکه پژوهشگری به نام مدعی شده بود که اگر درصدد آزمون مجدد یافته‌های نشریافته در مجلات معتبر برآیید درخواهید یافت که آن یافته‌ها کاذبند. بنابراین کوتاهی از جانب دانشجویان نبوده است، تقصیری اگر هست متوجه خود مقالات است.

مطالب مرتبط

چرا هر پزشک، فیلسوف هم باید باشد؟

تعامل با بیمار در دندانپزشکی زیبایی

پاسخ به دو انتقاد درباره طبی‌سازی مداخلات زیبایی در دندان‌پزشکی

همانطور که اشاره شد دهه‌ها بود که فیلسوفانی در نقد عینی انگاشتن یافته‌های پژوهش علمی سخن گفته بودند؛ اما اینبار دانشمندی نامدار، نقدی بسیار تند بر اعتبار علم وارد می‌کرد و نه فیلسوفی که بتوان با زدن انگ ناآشنایی با علم نقدهای او را نادیده گرفت. بنابراین بحث وارد مرحله‌ای جدید شد. با بالا گرفتن بحث دانشگاه ویرجینیا در آمریکا بودجه‌ا‌ی اختصاص داد تا دعاوی‌ای از این سنخ بررسی شوند و بیش از این اعتبار علم خدشه برندارد. به عنوان نمونه سه مجله‌ی معتبر روان‌شناسی انتخاب، و ۱۰۰ مقاله که در سال ۲۰۰۸ در این مجله‌ها چاپ شده بودند به صورت نمونه‌گیری تصادفی از میان آنها گزینش شدند و تلاش شد آزمایش‌ها به نحوی حتی‌الامکان مشابه مقاله‌ی اصلی تکرار شوند. یافته‌های جدید در سال ۲۰۱۱ چاپ شد و نتیجه بسیار مأیوس‌کننده بود. تنها یافته‌های ۳۵ مقاله تکرار شدند؛ آنهم با آلفایی بسیار بیش از آنچه در مقالات اصلی ادعا شده بود و بنابراین نشان داده شد احتمال خطای نوع اول، یعنی چاپ شدن مقاله‌ای که مدعی وجود رابطه‌ای بین پدیده‌هاست در حالیکه در واقع چنین رابطه‌ای وجود ندارد، بسیار بالاتر از دعوی مقالات است. (آلفا احتمال خطای نوع اول یا مثبت کاذب است.) اگر ارزش پی را به طور متعارف در حد پنج‌صدم در نظر بگیریم و بپذیریم مقالات چاپ شده نیز همگی الفایی کمتر از پنج صدم داشته‌اند، مطابق فهم عرفی دانشمندان، بدان معنا است که انتظار داشتیم حداقل ۹۵ یافته تکرار شوند. اما تنها ۳۵ مقاله تکرار شده بود. یعنی حق با یوانیدس بود. (در ادامه خواهیم دید که برد نشان می‌دهد عدد مورد انتظار باید ۶۷ باشد و نه ۹۵، اما حتی در آن‌صورت نیز ۳۵ بسیار کمتر از حد انتظار است.)

سال متعاقب نشر این پژوهش آماج حملات متوجه روان‌شناسی بود، زیرا عموماً ترجیح داده می‌شد که کسی متوجه این بحران در سایر رشته‌ها نشود. در حالیکه بحث یوانیدس عمدتاً متوجه پزشکی بود.

وقتی سال ۲۰۱۲ نام «بحران تکرارپذیری» وضع شد وجود مشکلی اساسی به رسمیت شناخته شد. حال پرسش این بود که اولاً چقدر مشکل جدی‌ست و ثانیاً علل آن کدامند؟ اگر می‌توانستیم به این دو پرسش پاسخی درخور دهیم آنگاه راه برون رفت نیز می‌توانست پیدا شود.

پرسش نخست این بود که «مشکل چقدر جدی‌ست». می‌توان به نحوی پیشینی درباره‌ی شدت یک بحران و عوارض آن سخن گفت. اما دانشمندان ترجیح می‌دهند پاسخ چنین پرسش‌هایی را به نحوی تجربی بدست آورند. بنابراین همه‌پرسی بزرگی از خود دانشمندان صورت گرفت و نتیجه در ویدئویی که در نیچر ۲۰۱۶ منتشر شد که همین پرسش را از ۱۵۷۶ دانشمند برتر جهان می‌پرسید. تنها سه درصد گفتند بحرانی وجود ندارد. هفت درصد ابراز بی‌اطلاعی کردند و نود درصد وجود مشکل را پذیرفتند. این نود درصد به دو زیرگروه تقسیم می شدند: ۳۸ درصد مشکل را خفیف دانستند و ۵۲ درصد مشکل را حاد ارزیابی کردند. بنابراین از منظر اکثریت دانشمندان مشکل جدی ارزیابی شد. در همان نظرخواهی از دانشمندان درباره‌ی علل بحران نیز نظرسنجی شد. دو علت بیش از سایرین مورد توجه بودند: مشکلات پیرامون آمار و روش تحقیق، و فشارهای اجتماعی که بر دانشمندان برای چاپ سریع مقالات وارد می‌شود. اما در ادامه تلاش می‌شود علاوه بر شرح این دو، به سایر عوامل دخیل نیز اشاره شود.

برگرفته از مقاله‌ی

صمدی، هادی، «بحران تکرارپذیری و ضرورت تغییر در سیاست‌گذاری چاپ مقالات علمی»، روش‌شناسی علوم انسانی، دوره ۲۷ شماره ۱۰۸، پاییز ۱۴۰۰، صص ۴۶-۳۳

هادی صمدی، استادیار فلسفه علم، واحد علوم و تحقیقات، دانشگاه آزاد