مروری بر تجارب جهانی کاربست کارآزمایی تصادفی کنتر ل شده (RCTs ) در چارچوب مراکز بینش رفتاری و ارائه توصیه هایی برای مجلس شورای اسلامی

مروتی, فاطمه; آرمانیان, زینب; ابراهیم کنی, محمدحسن

doi:10.22034/report.mrc.2024.1403.32.8.20233

مروری بر تجارب جهانی کاربست کارآزمایی تصادفی کنتر ل شده (RCTs ) در چارچوب مراکز بینش رفتاری و ارائه توصیه هایی برای مجلس شورای اسلامی

نوع گزارش : گزارش های راهبردی

نویسندگان

فاطمه مروتی

زینب آرمانیان

محمدحسن ابراهیم کنی

دفتر مطالعات بنیادین حکمرانی مرکز پژوهشهای مجلس شورای اسلامی

https://doi.org/10.22034/report.mrc.2024.1403.32.8.20233

چکیده

در سطح کلان و خرد حکمرانی به طور مستمر خط مشی ها، قوانین، برنامه ها و مداخلات با هدف بهبود وضعیت کشور و مردم و دستیابی به اهداف بالادستی طراحی، تصویب و اجرا می شود. با این حال عمدتا در مورد اینکه این خط مشی ها و قوانین تا چه اندازه به معنای واقعی اثربخش و کارآمد هستند، اطلاعات کمی وجود دارد. سیاستگذاران خط مشی ها، قوانین و برنامه ها جدیدی را طراحی و جایگزین موارد موجود می کنند بدون آنکه این اطمینان وجود داشته باشد آیا آنها موثر هستند یا خیر و یا چگونه می توان آنها را بهبود داد. از این جهت امروزه در سطح جهان رویکرد خط مشی گذاری شواهد محور و قانونگذاری شواهد محور گسترش یافته است. طبق این رویکرد نوین، سیاستگذاران پیش از تصویب و اجرای خط مشی ها، قوانین و برنامه های جدید، شواهد کافی را پیرامون اثربخشی آنها در اختیار دارند و مبتنی بر شواهد دقیق، موثرترین خط مشی ها را اتخاذ می کنند و کیفیت آن ها را بهبود می بخشند. یکی از بهترین و دقیق ترین روش برای اطلاع از اینکه آیا یک خط مشی، قانون یا برنامه اثربخش و کارآمد است یا خیر، کارآزمایی های تصادفی کنترل شده (RCTs) هستند. در این گزارش ظرفیت کارآزمایی های تصادفی کنترل شده در قانونگذاری شواهد محور مورد توجه قرار گرفته و ضمن آشنایی با این روش، الزامات و نحوه بکارگیری آن، پیشنهادات و توصیه هایی نیز پیرامون کاربست این روش در مجلس شورای اسلامی به عنوان یکی از مهمترین نهادهای حکمرانی کشور ارائه گردیده است.

گزیده سیاستی

امروزه در جهان، سیاستگذاران پیش از تصویب و اجرای خط مشی ها، شواهد کافی را پیرامون اثربخشی آنها تحلیل میکنند که از جمله ابزارهای آن کارآزمایی های تصادفی کنترل شده (RCTs)است. در این گزارش این ابزار در چارچوب مراکز بینش رفتاری مورد بررسی قرار گرفته و توصیه هایی برای مجلس شورای اسلامی ارائه شده است.

کلیدواژه‌ها

خط مشی گذاری رفتاری

کارآزمایی تصادفی کنترل شده

آزمایشگاه رفتاری

خط مشی گذاری شواهدمحور

قانونگذاری شواهدمحور

موضوعات

خلاصه مدیریتی

بیان/شرح مسئله

سیاستگذاران اغلب تصور می‌کنند درک خوبی از خط‌مشی‌ها، برنامه‌ها و مداخلات موثر دارند و می‌توانند اثربخشی آنها را پیش‌بینی کنند لذا مبتنی بر این تفکر، اغلب سیاستمداران، خط‌مشی‌ها و مداخلات را انتخاب و پیاده سازی می‌کنند. طبق تجربیات جهانی، نمونه‌های زیادی از خط‌مشی‌ها و مداخلات وجود دارند که نشان می‌دهند علی‌رغم اعتقاد بر اثربخش بودن، نه تنها موثر نبودند بلکه آسیب‌زا نیز بودند . خط‌مشی‌گذاری و قانونگذاری شواهد محور بهترین روش برای اجتناب از اشتباهات در اتخاذ خط‌مشی‌های کارآمد و موثر است که سبب می‌شود از اتلاف منابع و آسیب‌های احتمالی جلوگیری شود. خط‌مشی‌گذاری شواهد محور (EBP) تاکید می‌کند که خط‌مشی‌ها باید مبتنی بر بهترین شواهد موجود از تحقیقات و آزمایشات اتخاذ شوند تا پیش از تخصیص منابع این اطمینان وجود داشته باشد که اولا آن خط‌مشی در زمینه مدنظر امکان اجرایی شدن دارد، ثانیا مورد پذیرش واقع می‌شود و نهایتا موثر و کارآمد است .

در قلب هر RCT تعدادی عناصر کلیدی وجود دارد که نحوه عملکرد RCTها را نیز نشان می‌دهند: اولا انتخاب نمونه تصادفی و معرف جامعه و تقسیم جمعیت به دو یا چند گروه بر اساس تخصیص تصادفی؛ ثانیا ارائه یک مداخله به یک گروه و مداخله دیگر به گروهی دیگر و داشتن گروه کنترل؛ و نهایتا اندازه‌گیری پیامدهای از پیش تعیین شده (متغیر وابسته) برای هر گروه .

عموما در خط‌مشی‌گذاری‌ها دو نوع RCT را می‌توان اجرا کرد: اول RCTهای بهینه‌ساز که به دنبال بهبود اثربخشی خط‌مشی‌های موجود هستند و دوم RCTهای سیاستی که به دنبال آزمایش اثربخشی انواع مختلف خط‌مشی‌ها، برنامه‌ها یا مداخلات جدید و موجود هستند. اما صرف نظر از انواع RCTها باید گفت اصول هر دو یکی است: با مقایسه دو گروه یکسان که به طور تصادفی انتخاب شده اند، می‌توان طیف وسیعی از عوامل را کنترل کرد و قدرت تشخیص اینکه چه چیزی کارآمد است و چه چیزی کارآمد نیست را پیدا کرد .

استفاده از RCTها توسط نهادهای حکمرانی مزایای گوناگونی دارد:

۱- هزینه کردن بودجه‌ در خط‌مشی‌ها و برنامه‌های مقرون به صرفه

۲- ایجاد قدرت دفاع از تصمیمات خط‌مشی و افزایش اعتبار حاکمیت

۳- اصلاح مستمر خط‌مشی‌ها در جهت بهبود کارآیی آن‌ها

۴- ارائه چشم اندازی مطلوب برای پرداختن به موضوعات و رویکردهای سیاسی مناقشه‌برانگیز و دارای اختلاف نظر به کمک ارائه شواهد واقعی

نقطه نظرات/یافته‌های کلیدی

هر چند که استفاده از روش RCT بیش از ۷۰ سال است که در علوم پزشکی مورد استفاده قرار می‌گیرد اما بکارگیری RCTها در خط‌مشی‌گذاری‌های اجتماعی جهان در دو دهه اخیر رشد فراوانی پیدا کرده است و در حوزه‌های مختلف خط‌مشی‌گذاری اعم از جرم و عدالت، آموزش، رفاه اجتماعی، بهداشت، آموزش همچنین در توسعه بین المللی و تجارت و غیره پیاده سازی می‌شود .

با همراهی متخصصین، حمایت مسئولین و خط‌مشی‌گذاری مناسب، راه اندازی RCTها بسیار کم هزینه‌تر و ساده‌تر از آنچه اغلب تصور می‌شود، هستند. در ادامه دستورالعمل اجرای یک RCT آورده شده است. این دستورالعمل طبق چارچوب «آزمایش، یادگیری و تطبیق» تیم بینش‌های رفتاری انگلستان (BIT) که در سال ۲۰۱۲ ارائه شد، به شرح زیر است :

آزمایش

مرحله ۱: دو یا چند مداخله خط‌مشی را برای مقایسه شناسایی و انتخاب کنید.

مرحله ۲: نتیجه‌ای را که مداخله خط‌مشی قصد دارد بر آن تاثیر بگذارد و نحوه سنجش آن در آزمایش را تعریف کنید.

مرحله ۳: پیرامون واحد تصادفی سازی تصمیم‌گیری کنید.

مرحله ۴: تعیین کنید چه حجم نمونه‌ای برای دریافت نتایج قوی مورد نیاز است.

مرحله ۵: هر واحد را با استفاده از روش تصادفی‌سازی به یکی از مداخلات خط‌مشی اختصاص دهید.

مرحله ۶: مداخلات خط‌مشی را به گروه‌های اختصاص داده شده ارائه کنید.

یادگیری

مرحله ۷: نتایج را اندازه‌گیری کنید و تاثیر مداخله خط‌مشی را تعیین نمایید.

تطبیق

مرحله ۸: مداخله خط‌مشی را طبق نتایج به دست آمده، تطبیق دهید.

مرحله ۹: به مرحله اول بازگردید تا به طور مداوم درک خود از آنچه موثر است را بهبود ببخشید.

هر چند فرصت‌های اجرای RCT فراوان هستند اما تبدیل شدن اجرای RCTها در کشور به عنوان یکی از بخش‌های ضروری فرایند خط‌مشی‌گذاری نیازمند ایجاد ظرفیت و فراهم شدن شرایط لازم است. سه ظرفیت اساسی در این گزارش مطرح شده است که اگر این سه ظرفیت فعال شوند، می‌توان امید داشت که در حکمرانی کشور از شواهد به نحو موثر استفاده خواهد شد. این سه ظرفیت شامل فرهنگ و رهبری، تجربه و تخصص و نهایتا شفافیت است .

علاوه بر تجربیات جهانی از خط‌مشی‌گذاری حول ترویج رویکرد شواهد محور و کاربست کارآزمایی‌های تصادفی کنترل شده در اسناد بالادستی کشور نیز می‌توان مویداتی بر اهمیت استفاده از این رویکرد پیدا کرد. طبق بند نهم «سیاست‌های کلی نظام قانونگذاری» در قانونگذاری‌ها باید از قابل اجرا بودن قانون، قابل سنجش بودن قانون و ابتناء بر نظرات کارشناسی و ارزیابی تأثیر اجرای قانون اطمینان حاصل کرد و سازوکارهای لازم را جهت اعمال این موارد فراهم ساخت.

پیشنهاد راهکار‌های سیاستی، نظارتی یا تقنینی

نهایتا پیشنهادها و توصیه‌های این گزارش جهت ترویج و بکارگیری روش کارآزمایی تصادفی کنترل شده در فرایندهای مجلس شورای اسلامی به شرح زیر هستند:

۱- بهترین راه برای ترویج و بکارگیری RCTها، شروع تلاش است. یادگیری از تجربه و کار بر روی RCTها منجر به توسعه بلندمدت قابلیت RCT می‌شود.

۲- نمایندگان پیش از تصمیم‌گیری‌ها، شواهد و نتایج RCTهای مرتبط با قوانین، طرح‌ها و لوایح را از مراکز پژوهشی مطالبه نمایند و تصمیم‌گیری‌های خود و نیز تخصیص بودجه به قوانین و طرح‌ها را مبتنی بر شواهد ارائه شده انجام دهند.

۳- اهتمام جدی به بررسی اثربخشی قوانین و طرح‌ها پیش از تصمیم گیری قطعی با تخصیص درصدی از بودجه برنامه‌ها به ارزیابی پیشینی و کارآمدی طرح وجود داشته باشد.

4- مسئولین و نهادهای بالادستی حمایت، همراهی و انعطاف پذیری لازم را در جهت طراحی و اجرای RCTها انجام دهند و برای متخصصین دست‌اندرکار دسترسی‌ها، مجوزها و اختیارات مورد نیاز را فراهم کنند.

5- در نهایت از اشتراک گذاری و استفاده مناسب از داده‌ها و شواهد حمایت شود تا ضمن افزایش اعتبار ارزیابی‌ها و تصمیمات، سایر نهادها بتوانند از این شبکه داده‌ها بهره ببرند.

1.مقدمه

طبق قانون اساسی جمهوری اسلامی ایران، مجلس شورای اسلامی دارای صلاحیت عام قانونگذاری در کشور است. مجلس شورای اسلامی با صلاحیت قانونگذاری خود، مظهر اراده ملی و دارای جایگاهی ممتاز در ساختار حقوق اساسی جمهوری اسلامی ایران است. کارکرد تقنینی مجلس شورای اسلامی آنچنان حائز اهمیت است که رهبر معظم انقلاب در دیدار با نمایندگان مجلس فرمودند که «کیفیت قانونگذاری هر سال در قیاس با سال قبل باید بهبود یابد». این امر نشانگر اهمیت ویژه توجه به «کیفیت قانونگذاری» است. از نگاه رهبر انقلاب، صرف تصویب قوانین نباید به عنوان هدف غایی تلقی شود بلکه بایستی آثار و نتایج مصوبات مجلس بر جامعه نیز مشخص شود. برای مثال ایشان در دیدار نمایندگان و کارکنان مجلس شورای اسلامی فرمودند که «مهم این است که چیزی که تصویب شده است، چه قدر در رفع مشکلات و پیشرفت کشور و رعایت حال عموم مردم «تاثیر» داشته است، پس صرفا کمیت کفایت نمی‌کند و بایستی کیفیت را نیز ملاحظه کرد» [۱].

ارزیابی نتایج قوانین و خط‌مشی‌‌ها اساسا به حکمرانی سالم کمک می‌کند و می‌تواند بر طراحی و اجرای خط‌مشی‌‌های کارآمد، موثر باشد که به نوبه خود به ارتقای رفاه کشور و مردم منجر می‌شود. کارآزمایی‌ (آزمایش)های تصادفی کنترل‌شده (RCTs) یکی از بهترین روش‌های ارزیابی خط‌مشی‌‌ها هستند و در قلب جنبش خط‌مشی‌گذاری شواهد محور قرار دارند. خط‌مشی‌گذاری شواهد محور تاکید می‌کند که خط‌مشی‌‌ها باید مبتنی بر بهترین و قوی‌ترین شواهد موجود از تحقیقات، مقرون به صرفه بودن، اثربخشی، مقبولیت برای ذینفعان، پذیرش افکار عمومی و غیره طراحی و اجرا شوند [2]. این فرایند کمک می‌کند تا اطمینان حاصل شود که قوانین و مقررات پیشنهادی از نظر اثربخشی و نیز مقرون به صرفه‌بودن، کارآمد هستند. همانطور که مطرح شد، شواهد قابل استفاده انواع متنوعی دارند و RCTها یکی از قوی‌ترین و مهمترین انواع شواهد هستند که در این گزارش از این انواع شواهد صرفا به RCTها پرداخته می‌شود.

RCTها استاندارد طلایی هستند چراکه می‌توانند ارزیابی علّی انجام دهند و در تعیین اینکه آیا یک خط‌مشی‌ یا برنامه اثربخش و کارآمد است یا خیر نقش داشته باشند [3]. مبدا کارآزمایی‌های تصادفی کنترل‌شده به علوم پزشکی برمی‌گردد و این روش بیش از ۷۰ سال است که مورد استفاده قرار گرفته است. اما حدودا ۲ دهه است که RCTها به صورت جدی در خط‌مشی‌گذاری و قانونگذاری بکاربرده می‌شوند. امروزه RCTها به طور فزاینده‌ای در حوزه‌های مختلف قانونگذاری و خط‌مشی‌گذاری عمومی، توسعه بین المللی، تجارت و غیره مورد استفاده هستند [۴].

بسیاری از خط‌مشی‌‌ها و برنامه‌‌ها قبل از اینکه مورد ارزیابی قرار گیرند و شواهد کافی در مورد اثربخشی آن‌ها وجود داشته باشد، به طور گسترده و در سطح کشور اجرا می‌شوند زیرا طبق استدلال‌های منطقی و نظرات شهودی به نظر می‌رسد که کارآمد و موثر هستند. اما برخی از همین خط‌مشی‌‌ها پس از گذشت مدت زمانی از اجرایی شدن و صرف منابع و ایجاد هزینه‌های زیاد نتیجه مطلوب را حاصل نمی‌کنند و بی اثر بودن و یا حتی داشتن آسیب را نشان می‌دهند [۴]. استفاده از RCTها می‌تواند برای جلوگیری از این مسائل و اتخاذ خط‌مشی‌‌های کارآمد مفید باشد. در واقع اجرای کارآزمایی‌های تصادفی کنترل شده پیش از تصمیم‌گیری پیرامون تصویب قوانین و خط‌مشی‌ها سبب می‌شود تا قوانین موثر شناسایی شوند و بودجه به سمت موثرترین قوانین و خط‌مشی‌ها که بازدهی بالاتری دارند، هدایت شود و همچنین مبتنی بر شواهد به دست آمده، قوانینی که اثربخش نیستند و نتایج مورد انتظار را ارائه نمی‌دهند، شناسایی و حذف شوند.

با توجه به اهمیت کارآزمایی‌های تصادفی کنترل‌شده و مزایایی که استفاده از آنها در خط‌مشی‌گذاری عمومی دارد و همینطور بکارگیری این رویکرد در جهان و موفقیت آن، ضروری است رویکرد خط‌مشی‌گذاری شواهد محور نیز در حکمرانی ایران علی الخصوص در خط‌مشی‌گذاری‌ها و قانونگذاری‌های مجلس شورای اسلامی اتخاذ شود و از مزایای آن برای بهبود کارآمدی خط‌مشی‌‌ها و قوانین بهره برده شود.

گزارش حاضر با هدف نشان دادن کاربرد کارآزمایی‌های تصادفی کنترل شده در خط‌مشی‌گذاری شواهد محور و جایگاه‌ آن در فرایند‌های قانونگذاری مجلس شورای اسلامی تهیه شده است. در بخش اول این گزارش و در تبیین مبانی و دلالت‌های نظری به مقایسه خط‌مشی‌گذاری شواهد محور و خط‌مشی‌گذاری شهودی پرداخته می‌شود؛ سپس چیستی و ضرورت بکارگیری روش RCT توضیح داده می‌شود و مزایای استفاده از شرح داده می‌شود. در بخش دوم گزارش، تجربیات جهانی از بکارگیری این رویکرد در خط‌مشی‌گذاری مطرح می‌گردد تا گسترده استفاده جهانی از این رویکرد نشان داده شود. بخش سوم گزارش، ویژگی‌های منحصر به فرد و متمایز کننده روش RCT را مطرح می‌کند. بخش چهارم گزارش به الزامات و شرایط استفاده از این روش می‌پردازد. در بخش پنجم گزارش و در طی یک راهنمای عملی، دستورالعمل و نحوه استفاده از کارآزمایی‌های تصادفی کنترل شده ارائه می‌شود. بخش ششم گزارش، ضرورت و پایه‌های ظرفیت‌سازی در جهت کاربست این روش را مطرح می‌کند. نهایتا در بخش هفتم و آخر گزارش توصیه‌ها و پیشنهاداتی عملی و اجرایی برای مجلس شورای اسلامی در راستای بکارگیری این روش کارآزمایی‌ تصادفی کنترل شده ارائه می‌شود. امید است ضمن معرفی این رویکرد، زمینه‌های بکارگیری آن در کشور فراهم شود.

2. مبانی و دلالت های نظری

2-1. خط‌مشی‌گذاری شواهد محور در مقابل خط‌مشی‌گذاری شهودی

سیاستگذاران اغلب تصور می‌کنند درک خوب و کاملی از خط‌مشی‌‌ها، برنامه‌ها و مداخلات موثر دارند و می‌توانند اثربخشی آن‌ها را پیش‌بینی کنند فلذا مبتنی بر این تفکر، اغلب سیاستمداران، خط‌مشی‌‌ها و مداخلات را انتخاب و پیاده سازی می‌کنند [3]. ادبیات پژوهشی و نیز تجربیات جهانی نشان داده است که پیش بینی‌های مطمئن در مورد خط‌مشی‌‌های موثر توسط سیاستمداران و کارشناسان اغلب کاملاً درست نیستند [3]. طبق مفهوم نظری «پیامدهای ناخواسته» که توسط رابرت مرتون جامعه شناس آمریکایی مطرح شد، اقدامات هدفمند می‌توانند پیشآمدها و نتایجی که به صورت اولیه قابل پیش‌بینی نبودند، ایجاد کنند. این پیامدهای ناخواسته می‌توانند در سه دسته فایده غیرمنتظره، زیان غیرمنتظره و نتیجه انحرافی خلاصه شوند. تجربیات جهانی نیز نشان داده اند مداخلاتی که با اطمینان پیش‌بینی می‌شدند که اثربخش هستند، تاثیرگذار نبوده‌اند و بالعکس بعضاً مداخلاتی که به آن‌ها بدبینی وجود داشت، نهایتاً موفق و اثربخش بودند.

نمونه‌های زیادی نیز از خط‌مشی‌‌ها و مداخلات وجود دارند که نشان می‌دهند علیرغم اعتقاد به اثربخش بودن، نه تنها موثر نبودند بلکه مضر و آسیب‌زا بوده‌اند [3]. برای مثال برنامه scared straight برنامه‌ای دولتی با هدف کاهش سطح جرم و جنایت در میان نوجوانان آسیب پذیر در آمریکا بود. ایده اصلی این خط‌مشی‌ به لحاظ شهودی جذاب و مفید بود. این ایده بدین شرح بود: اگر نوجوانان با واقعیت‌های زندگی مجرمین آشنا شوند و عواقب احتمالی رفتارهای اکنون خود را ببینند، احتمال کمتری دارد به سمت رفتارهای مجرمانه سوق پیدا کنند و احتمالا تشویق می‌شوند تا بیشتر درس بخوانند و کمتر به سمت مواد مخدر و سایر رفتارهای مخرب روی بیاورند. این ایده به لحاظ شهودی جذاب است و موثر به نظر می‌رسد زیرا هشدار به نوجوانان سبب می‌شود بیشتر به زندگی سالم پایبند باشند و به این نحو از جرم پیشگیری می‌شود. این خط‌مشی‌ دهه‌ها در آمریکا توسط افرادی که نیت‌های مثبتی در جهت پیشگیری از جرم داشتند پیاده‌سازی شد. اما بعد از مدت‌ها، شواهدی از آزمایش‌های انجام شده به دست آمد که نشان می‌داد این مداخلات نه تنها برای پیشگیری از جرم موثر نبودند بلکه سبب افزایش جرم در نوجوانان می‌شدند [5]. نمونه‌ چنین ارزیابی‌هایی فراوان هستند که تاثیر معکوس، بی تاثیر بودن و یا حتی میزان تاثیرگذاری خط‌مشی‌‌ها را بررسی کرده‌اند و بینش‌های موثری به سیاستمداران برای اتخاذ رویکردهای کارآمدتر مبتنی بر شواهد قوی تجربی ارائه داده اند (برای نمونه به مورد ۱ و ۳ بخش تجربیات جهانی مراجعه شود). در واقع خط‌مشی‌گذاری شواهد محور بهترین روشی است که برای اجتناب از اشتباهات در اتخاذ خط‌مشی‌‌های کارآمد و موثر وجود دارد و سبب می‌شود از اتلاف منابع و آسیب‌های احتمالی جلوگیری شود زیرا در بهترین حالت میلیاردها تومان صرف برنامه‌هایی شده است که هیچ تاثیری نداشته‌اند و در بدترین حالت صدمات و آسیب‌های واقعی از روی ناآگاهی به انسآن‌ها و جامعه زده می‌شود [۴].

وقتی منابع مالی محدود است، اطمینان از اینکه منابع به صورت کارآمد سرمایه گذاری شود، اهمیت بیشتری می‌یابد. یک اصل اساسی خط‌مشی‌گذاری خوب این است که تصمیمات بر اساس شواهد قوی و آنچه اطمینان وجود دارد، موثر است، گرفته شود [7]. تصمیم گیری مبتنی بر شواهد (EIDM) یا خط‌مشی‌گذاری مبتنی بر شواهد (خط‌مشی‌گذاری شواهد محور) (EBP) تاکید می‌کند که خط‌مشی‌‌ها باید مبتنی بر بهترین شواهد موجود از تحقیقات و آزمایشات اتخاذ شوند تا پیش از تخصیص منابع این اطمینان وجود داشته باشد که اولا آن خط‌مشی‌ در زمینه مدنظر امکان اجرایی شدن دارد، ثانیا مورد پذیرش واقع می‌شود و نهایتا موثر و کارآمد است [2]. رویکرد خط‌مشی‌گذاری شهودی، عموما مبتنی بر حدس و گمان است و تصمیم‌گیری در مورد انتخاب خط‌مشی‌‌ها و برنامه‌ها براساس شهود انجام می‌شود. با توجه به سوگیری شناختی «خودتاییدی» وقتی خط‌مشی‌ یا برنامه‌ای اجرا شد تمایل وجود دارد که فقط موارد موفقیت آمیز آن دیده شود و مواردی که اثرگذار نبوده‌اند و یا حتی تاثیر معکوس داشته‌اند استثنا و غیر پایدار تلقی شوند زیرا طبق این سوگیری افراد تمایل دارند مواردی را بپذیرند که منطبق با باورهای قبلی آنها بوده است و مواردی که منطبق نیستند را رد کنند [5]. رویکرد «خط‌مشی‌گذاری مبتنی بر شواهد» درست در مقابل رویکرد «شواهد مبتنی بر خط‌مشی یا شواهد خط‌مشی محور» است که در آن شواهد به صورت انتخابی و برای حمایت از یک برنامه خط‌مشی از پیش تعیین شده استفاده می‌شوند [6].

جهت استفاده کارآمد از شواهد در خط‌مشی‌گذاری‌ها نیاز به «اکوسیستم شواهد» وجود دارد. یک اکوسیستم شواهد، سیستمی منعکس‌کننده پیوندها و تعاملات رسمی و غیررسمی بین بازیگران متعدد درگیر در امر شواهد است. این اکوسیستم شواهد را تولید می‌کند، سپس شواهد تولید شده را طبق نیاز خط‌مشی‌گذاری ترجمه می‌کند و نهایتاً کمک می‌کند تا شواهد به بهترین نحو در خط‌مشی‌گذاری مورد استفاده قرار گیرند [2]. از سال ۲۰۱۱ تا ۲۰۱۵ در انگلستان مجموعه‌ای از موسسات و مراکز دولتی و خصوصی برای ایجاد اکوسیستم شواهد و تقویت استفاده از شواهد توسط سیاستگذاران و شاغلین تاسیس شد. این مراکز یک هدف مشترک ساده داشتند: گردآوری و ایجاد شواهد بر اساس آنچه کارآمد است و قراردادن این شواهد در دسترس مسئولین و افراد ذی ربط. این مراکز در جهان، مراکز «what works» نامیده می‌شوند [5].

عملکرد این مراکز می‌تواند در چند مورد مفید باشد: اولین مورد، زمانی است که مسئولین و سیاستگذاران می‌خواهند بدانند بهترین نحوه هزینه کردن بودجه برای حل یک مسئله چیست. دومین مورد برای شرایطی است که سیاستگذاران به دنبال بهترین روش برای ارائه یک برنامه و چگونگی بهبود آن‌ها هستند و نهایتاً می‌تواند برای اینکه سیاستگذاران متوجه شوند که آن خط‌مشی‌ و برنامه تا چه اندازه مقرون به صرفه و کارآمد است، مفید واقع شود [7]. استفاده از روش آزمایشی توسط جنبش what works گسترش یافته و این مراکز در موضوعات مختلف و ذیل نهادهای دولتی مختلف به صورت اختصاصی تاسیس شده‌اند. برای مثال این مراکز به صورت اختصاصی در موضوعات آموزش، جرم و جنایت، فقر و رفاه، سلامت و غیره تاسیس شده و مشغول به فعالیت هستند. مجموعاً این جنبش به دنبال کاستن از خط‌مشی‌گذاری‌های شهودی و مبتنی بر فرضیات و حدس ‌وگمان و ارتقای خط‌مشی‌گذاری‌های مبتنی بر شواهد است تا امر خط‌مشی‌گذاری به صورت موثرتر و کم هزینه‌تر پیش رود.

کارآزمایی‌های تصادفی کنترل‌شده (RCT) در قلب جنبش شواهد محور در دو دهه اخیر خط‌مشی‌گذاری عمومی جهان هستند. RCTها به «استاندارد طلایی» مشهور هستند چرا که با توجه به ارزیابی‌های علّی که انجام می‌دهند، بهترین روش علمی موجود برای بررسی موثر بودن یک مداخله هستند. در بخش بعد بررسی می‌کنیم که RCTها چه چیزی هستند و چرا اهمیت دارند [8].

2-2. معرفی چیستی و ضرورت بکارگیری کارآزمایی‌های تصادفی کنترل‌شده (RCTs)

سیاستگذاران اغلب نیاز دارند بدانند کدام یک از دو یا چند خط‌مشی‌، برنامه یا مداخله در دستیابی به نتایج و اهداف خاص موثرتر هستند. به عنوان مثال قرار است برنامه‌ای جدید در مقابل برنامه‌های فعلی برای تشویق فرزندآوری در کشور طراحی شود. برای این کار لازم است اثربخشی و کارآمدی این دو برنامه با یکدیگر مقایسه شوند و سپس آنچه موثرتر است در مقیاس بزرگ اجرا شود. کارآزمایی‌های تصادفی کنترل‌شده (RCT) مشخصا برای ارزیابی تاثیرات علّی طراحی شده اند. استفاده از این روش به طور کلی جدید نیست و از علوم پزشکی وام گرفته شده است اما آنچه جدید است، استفاده از این روش در خط‌مشی‌گذاری می‌باشد [9]. در یک RCT برنامه یا خط‌مشی به عنوان یک مداخله در نظر گرفته می‌شود که در آن میزان اثربخش بودن مداخله توسط شاخص‌های از پیش تعیین شده‌ (متغیر وابسته) اندازه‌گیری می‌شود و مورد آزمایش قرار می‌گیرد. نقطه قوت RCT این است که پاسخ بسیار قدرتمندی به سوالات علّیت ارائه می‌دهد و به ارزیابان و مجریان خط‌مشی‌‌ها و سیاستگذاران کمک می‌کند تا مطمئن شوند نتیجه حاصل شده ناشی از مداخله است و نه موارد دیگر [10].

به طور معمول هنگام ارزیابی اثربخشی یک مداخله، به سادگی آن مداخله اجرا می‌شود و سپس با مشاهده نتایج، میزان اثربخشی نتایج آن قضاوت می‌شود [3]. برای مثال برنامه جدید تشویق فرزندآوری مدتی در کشور اجرا می‌شود و بعد بر روی میزان فرزندآورری در آن بازه نظارت می‌شود و اگر فرزندآوری نرخ خوبی داشته باشد قضاوت می‌شود که برنامه موثر بوده است.

با این حال این رویکرد که عموما استفاده می‌شود، دارای مشکلات گسترده‌ای است. یکی از اشکالات این است که با این رویکرد نمی‌توان تشخیص داد آیا مداخله سبب ایجاد نتایج شده است یا عامل خارجی کنترل‌نشده‌ دیگری مسبب ایجاد اثرات بوده است [3]. برای مثال ممکن است طرح تشویق فرزندآوری در کشور اجرا شود اما همزمان شرایط اقتصادی در کشور بهبود پیدا کند و بهبود شرایط اقتصادی سبب افزایش فرزندآوری شده باشد و به اشتباه رشد فرزندآوری به مداخله نسبت داده شود. کارآزمایی‌های تصادفی کنترل‌شده با ایجاد گروه‌ کنترل که به آنها مداخله جدید ارائه نمی‌شود، این مشکل را حل می‌کنند.

مشکل دوم و پیچیده‌تر این رویکرد ناشی از «سوگیری انتخاب» است. عموماً افرادی که می‌خواهند در طرح‌های تشویق فرزندآوری شرکت کنند، به طور سیستماتیک و پایه‌ای متفاوت با افرادی هستند که نمی‌خواهند شرکت کنند. این افراد عمدتاً انگیزه‌ بیشتری برای فرزندآوری دارند و به این معنی هرگونه نتایج مثبت مداخله می‌تواند بزرگنمایی شده باشد. کارآزمایی‌های تصادفی کنترل‌شده با حصول اطمینان از اینکه افراد و گروه‌هایی که مداخله را دریافت می‌کنند یا نمی‌کنند تا حد امکان مشابه یکدیگر هستند (با تخصیص تصادفی افراد به گروه‌ها) این مشکل را برطرف می‌کنند [3]. در مثال طرح تشویقی فرزندآوری، این مورد بدین صورت است که برای مثال ابتدا ۲۰۰۰ خانواده‌ که همگی واجد شرایط هستند انتخاب می‌شوند و سپس به طور تصادفی به دو گروه ۱۰۰۰ تایی تقسیم می‌شوند که یکی از گروه‌ها مداخله جدید (طرح جدید تشویق فرزندآوری) را دریافت می‌کند و دیگری طرح فعلی فرزندآوری را دریافت می‌کند که در واقع گروه کنترل می‌باشد. با وجود گروه کنترل و نیز تخصیص تصادفی، احتمال تاثیر عوامل خارجی از بین برده می‌شود و نشان داده می‌شود هرگونه تفاوت بین دو گروه صرفا نتیجه تفاوت در مداخله دریافتی جدید است.

با توجه به توضیحات بالا می‌توان گفت در قلب هر RCT تعدادی عناصر کلیدی وجود دارد. این عناصر کلیدی که نحوه عملکرد RCTها را نشان می‌دهند، بدین صورت هستند: اولا انتخاب نمونه تصادفی و معرف جامعه و تقسیم جمعیت به دو یا چند گروه بر اساس تخصیص تصادفی؛ ثانیاً ارائه یک مداخله به یک گروه و مداخله دیگر به گروهی دیگر و داشتن گروه کنترل؛ و نهایتاً اندازه‌گیری پیامدهای از پیش تعیین شده برای هر گروه [3]. این فرایند در شکل زیر خلاصه شده است:

شکل ۱. کاربست کارآزمایی تصادفی کنترل شده (RCTs) در دو گروه کنترل و مداخله

در توضیح تصویر بالا طبق مثال ساختگی این بخش می‌توان گفت فرض شود یک طرح جدید تشویق فرزندآوری در حال آزمایش است که هدف آن افزایش تعداد زنان باردار می‌باشد. جامعه مورد ارزیابی، زنان در سن باروری هستند و از این جامعه، نمونه کوچک اما قابل تعمیمی گرفته و به صورت تصادفی به دو گروه برابر تقسیم می‌شود. به زنان یکی از گروه‌ها، طرح تشویقی جدید معرفی می‌شود (گروه مداخله) و به گروه دیگر طرح فعلی ارائه می‌شود (گروه کنترل). در مثال شکل بالا زنانی که پس از گذشت ۶ ماه از ارائه طرح‌ها باردار شدند با رنگ سبز نشان داده شده اند. این کارآزمایی فرضی نشان می‌دهد تعداد بیشتری از زنان که در طرح جدید تشویق فرزند آوری شرکت کرده بودند به نسبت گروه کنترل اقدام به فرزندآوری کرده بودند و این یعنی طرح جدید به نسبت طرح فعلی جهت تشویق فرزندآوری موفق‌تر است. توجه به این نکته مهم است که دو نفر از زنان گروه کنترل نیز اقدام به فرزندآوری کرده اند که می‌تواند به دلیل سطحی از اثربخشی طرح فعلی و یا سایر عوامل باشد.

اگر طرح جدید تشویق فرزندآوری موثر نباشد، الگوی مشابهی در گروه مداخله و گروه کنترل مشاهده می‌شود. این حالت در شکل بعدی نشان داده شده است:

شکل ۲. کاربست کارآزمایی تصادفی کنترل شده (RCTs) در دو گروه کنترل و مداخله (عدم موفقیت مداخله)

در اینجا نتایج RCT نشان می‌دهد که برنامه جدید و پرهزینه تشویق فرزندآوری، بهتر و موثرتر از طرح‌های فعلی کشور در حمایت از فرزندآوری نیست. از این نتیجه فهم می‌شود که اگر هیچ گروه کنترلی وجود نداشت ممکن بود از ۲ نفری که اقدام به فرزندآوری کرده بودند به اشتباه این نتیجه‌گیری شود که طرح جدید، موثر است و همین مورد سبب می‌شد طرحی پرهزینه و ناکارآمد برای مدت طولانی در کشور اجرایی شود و سبب اتلاف منابع گردد.

می‌توان گفت در هر موردی که ظرفیت عوامل خارجی برای تاثیرگذاری بر نتایج یک خط‌مشی‌ وجود داشته باشد، همیشه ارزش دارد که از RCT برای آزمایش اثربخشی مداخله قبل از اجرای آن خط‌مشی‌ بر روی کل جمعیت کشور استفاده شود. وقتی این کار انجام نمی‌شود به راحتی تاثیر سایر عوامل را می‌توان به یک خط‌مشی‌ یا برنامه ناکارآمد نسبت داد [3].

در مثال ساختگی طرح تشویق فرزندآوری مطرح شده در این بخش به دنبال بررسی اثربخشی دو نوع مداخله و برنامه متفاوت بودیم. اما نکته حائز اهمیت این است که در بسیاری از موارد یک RCT می‌تواند برای مقایسه چندین روش مختلف اجرای جنبه‌های مختلف و کوچکتر یک خط‌مشی‌ یا برنامه خاص نیز استفاده شود. در واقع آزمایش بخش‌های کوچکتر یک برنامه خاص نیز سیاستگذاران را قادر می‌سازد تا به طور مستمر خط‌مشی مدنظر را اصلاح کنند و بر جنبه‌های خاصی از خط‌مشی‌ که بیشترین تاثیر را دارد، توجه کنند [3].

از این رو می‌توان گفت عموما در خط‌مشی‌گذاری‌ها دو نوع RCT را می‌توان اجرا کرد:

۱) RCTهای بهینه‌ساز که به دنبال بهبود اثربخشی خط‌مشی‌های موجود هستند.

۲) RCTهای سیاستی که به دنبال آزمایش اثربخشی انواع مختلف خط‌مشی‌‌ها، برنامه‌ها یا مداخلات جدید و موجود هستند.

اما صرف نظر از انواع RCTها اصول هر دو یکی است: با مقایسه دو گروه یکسان که به طور تصادفی انتخاب شده‌اند، می‌توان طیف وسیعی از عوامل را کنترل کرد و قدرت تشخیص اینکه چه چیزی کارآمد است و چه چیزی کارآمد نیست را پیدا کرد [6].

2-3. مزایای استفاده از کارآزمایی‌های تصادفی کنترل‌شده (RCTs) توسط نهادهای حکمرانی

ارزیابی خط‌مشی‌‌ها به حکمرانی عمومی سالم کمک می‌کند. این امر می‌تواند به نهادهای حاکمیتی در بهبود طراحی و اجرای خط‌مشی‌‌های عمومی کمک کند که به نوبه خود می‌تواند به رفاه کشور و رفاه شهروندان منجر شود. همچنین ارزیابی خط‌مشی‌‌ها و برنامه‌ها به ارتقای پاسخگویی عمومی و افزایش اثربخشی اقدامات حکمرانی از طریق بهبود تصمیم‌گیری‌ها کمک می‌کند [۱۴]. از آنجایی که RCTها محور و مرکز ارزیابی‌های خط‌مشی‌ هستند، می‌توان مزایایی را برای بکارگیری RCTها توسط نهادهای حکمران برشمرد:

۱) اولین و مهمترین مزیت بکارگیری RCT‌ها هزینه کردن بودجه‌ در خط‌مشی‌‌ها و برنامه‌های مقرون به صرفه است. در شرایط متفاوت و یا برخی مسائل که منابع مالی کشور محدود است، اطمینان از اینکه آن منابع محدود در خط‌مشی‌‌ها و برنامه‌های موثر، هزینه‌ و سرمایه‌گذاری می‌شود، اهمیت می‌یابد. سیاستگذاران نیاز دارند با آگاهی کامل از اثربخشی خط‌مشی‌‌ها و برنامه‌ها، پیرامون آنها تصمیم‌گیری کنند. همچنین در شرایطی که سیاستگذاران بین دو یا چند پیشنهاد خط‌مشی‌ و برنامه در یک حوزه خاص در ابهام باشند، نتایج RCTها پیرامون میزان اثربخشی هر یک از آنها می‌تواند کمک کند تا تصمیم‌گیری با سهولت بیشتری انجام شود و این اطمینان وجود داشته باشد که منابع کشور صرف آن خط‌مشی می‌شود که اثربخش و کارآمد است و می‌تواند اهداف مدنظر را محقق کند.

۲) دومین مزیت استفاده از RCT‌ها ایجاد قدرت دفاع از تصمیمات خط‌مشی‌ و افزایش اعتبار حاکمیت می‌باشد. مسئولین و سیاستگذاران و به طور کلی حاکمیت در خلا عمل نمی‌کنند زیرا باید از تصمیمات خود در برابر طیف وسیعی از ذینفعان از جمله مردم، گروه‌ها، مشاغل و اصناف، سرمایه‌گذاران و غیره دفاع کنند. بکاربردن RCT‌ها پیش از تصمیم‌گیری و اجرای خط‌مشی‌‌ها می‌تواند این اطمینان را ایجاد کند که حاکمیت می‌تواند از تصمیمات و خط‌مشی‌‌های اتخاذ شده دفاع کند زیرا شواهد واضحی از کارآمدی و اثربخشی و مقرون به صرفه بودن آنها در اختیار دارد که همین امر منجر به افزایش اعتبار حاکمیت خواهد شد. بنابراین در صورت داشتن شواهد، حاکمیت می‌تواند این اطمینان را به ذینفعان بدهد که خط‌مشی‌ اتخاذ شده کارآمد و اثربخش است، ارزش هزینه کردن بودجه عمومی را دارد و از همه مهمتر انتظارات واقع بینانه‌ای را در رابطه با اثربخشی خط‌مشی‌‌ها در افکار عمومی ایجاد می‌کند [۱1].

۳) سومین مزیت بکارگیری RCTها این است که سبب اصلاح مستمر خط‌مشی‌‌ها در جهت بهبود کارآیی آنها می‌شود. با توجه به اینکه کارکرد اصلی RCTها ارزیابی تاثیرات علّی است، اجرای آنها می‌تواند بینش‌های بسیار خوبی به سیاستگذاران پیرامون دلایل و فرآیندهای موفقیت یا شکست یک خط‌مشی‌ بدهد. همچنین از آنجایی که RCTها می‌توانند ضمن ارزیابی کلی یک خط‌مشی‌ و مقایسه خط‌مشی‌‌ها، رویکردها و برنامه‌های گوناگون با یکدیگر، وجوه و جنبه‌های اثربخشی خط‌مشی‌‌ها و برنامه‌ها (حتی وجوه و جنبه‌های جزئی آن‌ها) را نیز ارزیابی کنند، اجرای مستمر RCTها سبب اصلاح مستمر و دائمی خط‌مشی‌‌ها خواهد شد و می‌تواند سیاستگذاران را به سمت شرایط و مداخلات اثربخش‌تر و بهینه کردن دائمی آنها راهنمایی کند [3].

۴) مزیت دیگر اجرای RCTها در خط‌مشی‌‌های اجتماعی، دادن یک چشم انداز مطلوب برای پرداختن به موضوعات و رویکردهای سیاسی مناقشه ‌برانگیز و با اختلاف نظر به کمک ارائه شواهد واقعی است. در حوزه‌ها و موضوعاتی که بین سیاستگذاران اختلاف نظر وجود دارد که کدام خط‌مشی‌، رویکرد، برنامه یا مداخله‌ای موثرتر است، RCTها می‌توانند توسط طرف‌های مختلف مورد استفاده قرار گیرند و پیشنهادات گوناگون از طریق اجرای RCTها مورد ارزیابی قرار گیرد و میزان کارآمدی هر یک مشخص شود [6].

نهایتا می‌توان گفت نهادهای حاکمیتی در موقعیت بسیار مناسبی برای اجرای RCTها قرار دارند. این نهادها عمدتا منابع قابل توجهی دارند و خط‌مشی‌‌ها و مداخلاتی را اجرا می‌کنند که بر جمعیت‌های بزرگی از مردم اثر می‌گذارد و می‌تواند تاثیرات پایداری بر کشور داشته باشد. با توجه به اینکه برای اجرای RCTهای خوب و قوی به جمعیت‌های بزرگ‌ نیاز است و نهادهای حاکمیتی به این جمعیت‌ها دسترسی کافی دارند، می‌توانند مرجع بسیار مناسبی برای اجرای RCTها باشند. همچنین از آنجایی که نهادهای حاکمیتی داده‌های بسیار زیادی از شهروندان و رفتار آن‌ها و نیز سایر اتفاقات جاری کشور در اختیار دارند، می‌توانند با هزینه کم و با سهولت بیشتری نسبت به مجموعه‌های خصوصی، RCTها را اجرا کنند و اثربخشی تصمیمات و مداخلات را بسنجند [6].

3.تجربیات جهانی کاربرد کارآزمایی‌های تصادفی کنترل شده (RCTs)در حکمرانی

ریشه‌های استفاده از RCT در خط‌مشی‌های عمومی به دهه ۱۹۲۰ برمی‌گردد. پیشرفت‌های اولیه در استفاده از کارآزمایی‌های تصادفی کنترل شده در مطالعه خط‌مشی‌‌های عمومی همزمان با استفاده آن توسط روان‌شناسی برای مطالعه رفتار انسان بود. در ابتدای دهه ۱۹۲۰ سیاستگذاران شروع به استفاده از آزمایش‌ کردند و دانش آن را منتشر ساختند؛ مانند مطالعاتی برای بررسی تاثیر ارائه شیر در مدارس بر سلامتی کودکان که این مطالعات در ابتدا شکست‌هایی را تجربه کردند که ناشی از دانش ناکافی از اصول اجرای آزمایش و همچنین سختی‌های اجرای آن بود، با این حال این مطالعات تا چند دهه بعد و حدودا تا سال ۱۹۳۹ ادامه پیدا کردند و بعد از آن دوباره بی ‌استفاده ماند [۱2].

علاقه دوباره به استفاده از آزمایش‌های میدانی به دهه ۱۹۶۰ ومطالعات کمپل بر روی ویژگی‌های آماری آزمایش‌ها برمی‌گردد. گسترش خط‌مشی‌‌های رفاهی در دهه ۱۹۶۰ تقاضاها برای ارزیابی مستحکم‌تر خط‌مشی‌‌ها را بیشتر کرد. در دهه‌های ۱۹۷۰ و ۱۹۸۰ مطالعات زیادی در حوزه‌هایی چون بهزیستی، مالیات، محیط کار، جرم و جنایت و اشتغال با تمرکز بر دولت آمریکا صورت گرفت. یکی از رویدادهای مهم در این تاریخچه قانون فدرال اصلاحات علوم آموزشی در سال ۲۰۰۲ بود که در آن کنگره آمریکا بر استفاده از کارآزمایی‌های تصادفی‌سازی‌شده تاکید کرد و در نتیجه باعث رشد قابل‌توجه کارآزمایی‌هایی آموزشی در این کشور شد. علاقه فزاینده به RCTها باعث شد تا این ایده پیشنهاد شود که آزمایش‌های سیاستی و اجتماعی، راهی موثر برای حکمرانی می‌باشد [۱2].

بکارگیری RCTها در خط‌مشی‌گذاری‌های اجتماعی جهان در سال‌های اخیر رشد بی سابقه‌ای پیدا کرده است و در موضوعات مختلف اعم از جرم و عدالت، آموزش، رفاه اجتماعی، بهداشت، آموزش و غیره اجرا می‌شود. طبق بررسی‌های کمپل از RCTهای با کیفیت انجام شده در جهان تا سال ۲۰۱۴، آمریکای شمالی در تولید RCTهای سیاستی پیشتاز است و رتبه اول در جهان را دارد. کانادا، انگلستان و استرالیا در رتبه‌های بعدی قرار دارند. قابل توجه اینکه در این لیست سه کشور در حال توسعه (هند، کنیا و مکزیک) نیز هستند که در خط‌مشی‌گذاری‌ها از روش RCT استفاده می‌کنند [6]. در نقشه زیر کشورهای جهان را به تفکیک حوزه موضوعاتی که در آن‌ها RCT انجام داده اند در سال ۲۰۱۶ نشان می‌دهند [۱3].

شکل ۳. نقشه استفاده کشورها از کارآزمایی تصادفی کنترل شده (RCTs) به تفکیک حوزه موضوعات

تقریبا سه چهارم RCTهای ثبت شده آمریکا توسط دولت به نهادهای دانشگاهی سفارش داده شده است و تعداد محدودی به طور مستقل توسط یک اداره دولتی انجام شده است. این نشان می‌دهد در آمریکا تخصص و اشتیاق زیادی برای انجام RCTهای سیاستی در دانشگاه‌ها وجود دارد. همچنین در آمریکا بیش از ۵۰ درصد RCTها در حوزه بهداشت و سلامت و آموزش بوده اند (اما در سایر نقاط جهان توزیع موضوعی در سایر حوزه‌های سیاستی وجود دارد). دولت آمریکا به طور فعال از رشد RCTها حمایت زیادی می‌کند (برای مثال با تأسیس صندوق‌های نوآوری اجتماعی و سرمایه گذاری‌های اجتماعی این حمایت‌ها را اعمال می‌کند). تیم علوم اجتماعی و رفتاری (SBST) آمریکا که در سال ۲۰۱۵ تأسیس شد، مداخلات بینش‌های رفتاری را در دولت بکار می‌برد و پیشرو در امر ارزیابی‌های خط‌مشی‌ و انجام RCTها است [6].

شناخته شده ترین مرجع انجام RCT در دولت انگلستان تیم بینش‌های رفتاری (BIT) است که در سال ۲۰۱۰ در دفتر نخست وزیر به عنوان اولین موسسه بینش‌های رفتاری جهان شروع به کار کرد و اکنون به طور منظم مداخلات رفتاری و RCTها را در حوزه‌های سیاستی گوناگون اجرا می‌کند. این تیم رویکرد اختصاصی «آزمایش، یادگیری و تطبیق» را برای اولین بار در سال ۲۰۱۲ ایجاد کرد [6] و در سال ۲۰۲۲ نیز رویکرد پیشرفته‌تر TESTS را ایجاد کرد تا به طور سیستماتیک‌تر و ساختاریافته‌تری از رویکرد شواهدمحوری در فرایند خط‌مشی‌گذاری استفاده شود [۱4]. همچنین طبق گزارش‌های موجود، این تیم تا سال ۲۰۲۰ بیش از ۵۰۰ کارآزمایی تصادفی کنترل‌شده را در حیطه‌های گوناگون سیاستی طراحی و اجرا کرده است [۱5].

علاوه بر BIT، انگلستان همچنین شبکه‌ای از مراکز What Works را ایجاد کرده است. این مراکز مستقل از دولت، شواهد به دست آمده از اثربخشی مداخلات در یک حوزه موضوعی خاص را ایجاد و گردآوری می‌کنند و آنها را به شیوه‌ای در دسترس با دست اندرکاران، مسئولین و سیاستگذاران به اشتراک می‌گذارند [6]. این شبکه در حال حاضر شامل ۶ مرکز What Works است که مراکز دیگری نیز در حال پیوستن به این شبکه هستند. قدیمی‌ترین و پرکارترین این مراکز، بنیاد وقف آموزش (EEF) است که مجموعه‌ای از شواهد در حوزه آموزش را با هدف ارتقای کیفیت آموزش در انگلستان ایجاد کرده است و سه مرحله کارآزمایی را تأمین مالی و اجرا می‌کند: اول پایلوت (اصلاح مداخله‌ای که در مرحله اولیه یا توسعه است)، دوم کارآزمایی‌های کارآمدی (مشاهده اینکه یک مداخله تحت شرایط ایده آل چه قدر کارآمدی دارد) و سوم کارآزمایی‌های اثربخشی (مشاهده اینکه یک مداخله تحت شرایط واقعی و در مقیاس ملی چه قدر اثربخش است) [6]. سایر مراکز What Works این شبکه عبارتند از: موسسه ملی تعالی بالینی و سلامت (NICE)، موسسه کاهش جرم، موسسه رشد اقتصاد محلی، موسسه سالمندی بهتر و نهایتا موسسه مداخلات زودهنگام [7].

یکی دیگر از محورهای گسترش استفاده از RCTها در خط‌مشی عمومی، بکارگیری آن در کشورهای کمتر توسعه یافته و در موضوعات مرتبط با توسعه به ویژه در رابطه با ارزیابی برنامه‌های حمایتی از این کشورها است. برای مثال دو سازمانی که نقش موثر در این زمینه داشته اند، آزمایشگاه اقدام برای فقر عبداللطیف جمیل (J-PAL) و مرکز اقدام برای نوآوری فقر هستند [۱2]. بکارگیری این دسته از RCTها از حدود سال ۲۰۰۰ رایج شده است. برای مثال آزمایشگاه اقدام برای فقر عبداللطیف جمیل تا سال ۲۰۱۴، بیش از ۷۰۰ RCT را در کشورهای مختلف برای بررسی اثربخشی اقدامات مقابله با فقر و ارتقای رفاه اجرا کرده است [6]. نتیجه این کارها منجر به جایزه نوبل اقتصاد در سال ۲۰۱۹ شد که استر دافلو (بنیانگذار و مدیرعامل آزمایش اقدام برای فقر عبدالطیف جمیل)، آبیجیت بنرجی و مایکل کرامر بخاطر استفاده از رویکرد آزمایشی در حوزه فقر آن را دریافت کردند.

در ادامه برای نمونه به چند مورد از تجربیات جهانی استفاده از RCTها در خط‌مشی‌گذاری پرداخته می‌شود:

3-1. تجربه وزارت کار و بازنشستگی (DWP) انگلستان در ورود افراد ناتوان به بازار کار

در سال ۲۰۰۳، وزارت کار و بازنشستگی (DWP) انگلستان یک RCT برای بررسی تأثیر سه برنامه جدید برای متقاضیان مزایای از کار افتادگی انجام داد تا بررسی کند کدام یک به این افراد کمک می‌کند بتوانند به بازار کار برگردند: اولین برنامه پیشنهادی مرتبط با حمایت در محل کار بود. دومین برنامه حمایت متمرکز بر نیازهای سلامت فردی افراد بود و سومین پیشنهاد ترکیبی از هر دو برنامه‌ بود. لازم به ذکر است که طبق محاسبات هزینه حمایت و ارائه مزایای از کار افتادگی به طور متوسط برای هر نفر ۱۴۰۰ پوند بود. پس از انجام RCT، نتایج نشان داد که هیچ مزیتی نسبت به پشتیبانی استانداردی که از قبل در دسترس بود وجود ندارد یعنی مزایای اضافی از کار افتادگی بر روی افزایش بازگشت به کار این افراد تاثیری ندارد. لذا نتیجه RCT در نهایت سبب شد میلیون‌ها پوند در هزینه دولت صرفه‌جویی شود، زیرا شواهد واضحی وجود داشت مبنی بر اینکه حمایت اضافی پرهزینه اثر مورد نظر را نداشته است [3]. این نمونه یکی از مثال‌های طرح‌های پرهزینه‌ای است که در صورت بررسی اثربخشی نشان می‌دهند، سرمایه گذاری برای آنها مقرون به صرفه نیست.

3-2. تجربه مشارکت پرستار خانواده؛ پیشگیری از آسیب پذیری مادران در آمریکا

مشارکت پرستار خانواده یک طرح پیشگیرانه برای مادران آسیب پذیر است. این طرح که در آمریکا توسعه یافته است شامل معاینات مرتب در خانه توسط پرستار آموزش دیده از ابتدای بارداری تا دو سالگی کودک است. چندین RCT مزایا و اثرات قابل توجهی را برای خانواده‌های محروم و صرفه جویی قابل توجهی در هزینه‌ها نشان داده اند. برای مثال این کودکان رشد اجتماعی-عاطفی بهتر، سلامت بیشتر، پیشرفت تحصیلی بهتر و انجام جرم کمتری داشتند. مادران دخیل در این طرح نیز سلامت بیشتری داشتند و احتمال بیشتری داشت شاغل باشند و کمتر درگیر جرم شدند. این طرح از سال ۲۰۰۷ آغاز شد و با توجه به نشان دادن اثربخشی آن توسط RCTهای متعدد، تصمیم گرفته شد طرح تا سال ۲۰۱۵ به دو برابر گسترش یابد و ۱۳۰۰۰ مادر را تحت پوشش قرار دهد [3]. این نمونه یکی از مثال‌های سرمایه‌گذاری و گسترش یک طرح موفق مبتنی بر نتایج ارزیابی‌ها است.

3-3. بررسی اثربخشی اعطای وام‌های خرد کارآفرینی در حیدرآباد هند

یکی از ابزارهای توسعه در دهه گذشته، اعتبارات خرد است. وام‌های کوچک کارآفرینی با هدف ایجاد فرصتی برای حمایت از کارآفرینی مورد توجه قرار گرفته است. آمارها نشان می‌دهد بین ۱۵۰ تا ۲۰۰ میلیون وام گیرنده خرد در جهان وجود دارد. با این حال موجی از مشکلات در هند این فرضیه را ایجاد کرد که بانک‌های خصوصی و بهره‌های بالایی که در وام از مشتریان دریافت می‌کنند در این مسئله نقش دارد. اما بررسی کارآمدی و اثربخشی وام‌های کارآفرینی نیاز به شواهد بیشتری دارد. در سال ۲۰۱۳ مجموعه RCTهایی در حیدرآباد هند بر روی وام گیرندگان یک بانک خصوصی که عمدتا در محله‌های فقیر نشین بودند، انجام شد تا اثرات برنامه‌های اعطای وام‌های کارآفرینی مشخص شود. ۱۵ تا ۱۸ ماه پس از انجام RCTها شواهد نشان داد که کارآفرینانی که وام دریافت کرده بودند، بیشتر در مشاغل خود سرمایه‌گذاری کردند و هزینه‌های بیشتری بر روی کالاهای بادوام انجام دادند. البته نتایج نشان داد که با دریافت وام هیچ افزایشی در تعداد کسب‌وکارهای راه اندازی شده یا سود شرکت‌های موجود ایجاد نشد. همچنین هیچ تاثیری بر شاخص‌های متعارف توسعه مانند هزینه‌های مصرف، بهداشت، آموزش یا توانمندسازی زنان دیده نشد. این نتایج لزوما به این معنی نبودند که اعتبارات خرد هیچ تاثیری نداشتند بلکه نشان داد ارائه وام‌های کارآفرینی راه‌حل شگفت انگیزی به اندازه‌ای که تصور می‌شود، نیستند [9].

3-4. ارائه مداخلات رفتاری بهینه ساز و اجرای RCT برای سنجش اثربخشی

به طور کلی تیم‌های بینش‌های رفتاری جهان که ملاخلات رفتاری را در خط‌مشی‌گذاری‌ها طراحی و اجرا می‌کنند، پیشرو در اجرای RCTها برای بررسی اثربخشی مداخلات خود هستند. در ادامه به عنوان نمونه به نتایج کارآزمایی‌های چند مداخله رفتاری که توسط تیم‌های بینش‌های رفتاری اجرا شده است، اشاره می‌شود:

- افزایش درآمد مالیاتی: بسیاری از دولت‌ها در سراسر جهان با استفاده از مداخلات رفتاری و ارزیابی اثربخشی توسط RCT درآمدهای مالیاتی خود را افزایش داده اند. برای مثال دولت انگلیس یک نامه مالیاتی مبتنی بر اصول رفتاری برای افرادی که هنوز مالیات خود را پرداخت نکرده بودند ارسال کرد. طبق شواهد به دست آمده از RCT همین نامه نرخ تمکین مالیاتی را تا ۱۵ درصد افزایش داد و سالانه ۳۰ میلیون پوند درآمد مالیاتی به دولت اضافه کرد [6].

- افزایش پرداخت عوارض: تیم بینش‌های رفتاری (BIT) انگلستان یک RCT موفق را با استفاده از یاداورهای پیامکی مبتنی بر اصول رفتاری اجرا کرد تا مردم را تشویق کند عوارض خود را پیش از جریمه شدن پرداخت کنند. تعدادی از مداخلات مورد آزمایش قرار گرفتند که همگی به طور قابل ملاحظه‌ای نرخ پرداخت را بهبود دادند. طبق نتایج کارآزمایی همین پیامک یادآوری سبب شد ۸۶۰ هزار پوند در هفته درآمد به صندوق دولت افزوده شود [6].

- افزایش اهدای عضو: در سال ۲۰۱۳ دولت انگلیس یک RCT آنلاین برای افزایش ثبت نام اهدای عضو با مشارکت تیم بینش‌های رفتاری (BIT) اجرا کرد. در این کارآزمایی تاثیر هشت صفحه وب مبتنی بر اصول رفتاری بر روی افرادی که برای ثبت گواهینامه یا تمدید مالیات خودرو مراجعه می‌کردند، سنجیده شد. در ۵ هفته بیش از ۱ میلیون نفر از این صفحه بازدید کردند (هر نوع ۱۳۵۰۰۰ نفر). نتایج RCT نشان داد مشاهده این اصل رفتاری ساده که به شکل یک جمله ارائه شد بود، منجر به ۳۹ درصد ثبت نام بیشتر در طرح اهدای عضو شد. این معادل ۱۰۰۰۰۰ ثبت نام کننده اضافه اهدای عضو در سال در نتیجه افزودن یک جمله به یک صفحه وب بود [6].

- افزایش تزریق واکسن کرونا: در ایران نیز در سال ۱۴۰۰ کارآزمایی تصادفی کنترل‌شده ای توسط مرکز بینش‌های رفتاری ایران و با همکاری وزارت بهداشت با هدف افزایش واکسیناسیون کووید-۱۹ انجام شد. در این کارآزمایی، پیامک‌های یادآوری تزریق واکسن که مبتنی بر اصول علوم رفتاری طراحی شده بودند به افرادی که دوز دوم و سوم واکسن کرونای خود را دریافت نکرده بودند، ارسال شد. نتایج RCT نشان داد که ارسال پیامک رفتاری سبب افزایش ۳۷ درصدی تزریق دوز دوم واکسن و افزایش ۳۰ درصدی تزریق دوز سوم واکسن کرونا شد. پس از ارائه شواهد اثربخشی این مداخله کم هزینه بر روی افزایش نرخ واکسیناسیون کشور، این پیامک در مقیاس ملی برای افراد واکسن نزده ارسال شد. طبق محاسبات این مداخله رفتاری در کشور سبب جلو افتادن ۲۸ روز کشور در فرآیند واکسیناسیون شد [۱6].

3-5. مطالعه موردی یک مرکز What Works در حوزه آموزش؛ کاربست کارازمایی‌های تصادفی کنترل شده متعدد در بهبود پیشرفت تحصیلی دانش آموزان در انگلستان

در زمینه آموزش، بنیاد وقف آموزش (EEF) اخیرا یک جعبه ابزار آموزشی و یادگیری منتشر کرده است که توسط دانشگاهیان دانشگاه دورهام تهیه شده است. در این جعبه ابزار خلاصه‌ای رایگان و در دسترس از بیش از ۵۵۰۰ مطالعه تحقیقاتی و RCT در اختیار معلمان و مدارس قرار گرفته است که از این منابع و شواهد برای بهبود پیشرفت دانش آموزان استفاده کنند. در واقع این مرکز What Works ماموریت دارد تا با تولید شواهد علمی متعدد و نیز منسجم کردن و پیوند آن‌ها، شواهد علمی مورد نیاز در حوزه آموزش را از برنامه‌ها و مداخلات موثر بر روی عملکرد دانش آموزان برای مدارس و معلمان فراهم کند. این جعبه ابزار به صورت رایگان در وب سایت Sutton Trust/EEF در دسترس است (البته قبلا به صورت اختصاصی برای معلمان ارشد در سراسر انگلستان منتشر شده بود). علاوه بر این جعبه ابزار، EEF همچنین در حال آزمایش ابتکارات نوآورانه برای بهبود پیشرفت دانش آموزان در سراسر انگلستان است. این آزمایشات تا سال ۲۰۱۳ بیش از ۲۷۵۰۰۰ دانش آموز و ۱۴۰۰ مدرسه را درگیر کرده بود [7].

در تصویر زیر نمونه‌ای از صفحه این سایت قابل مشاهده است:

شکل ۴. جعبه ابزار معرفی شده توسط مرکز What Works با هدف معرفی موثرترین روش‌ها در بهبود پیشرفت تحصیلی دانش آموزان انگلستان

4. ویژگی‌های کارآزمایی‌های تصادفی کنترل شده (RCTs)

کارآزمایی‌های تصادفی کنترل‌شده (RCT) امروزه در جهان در حوزه‌های متنوعی اعم از خط‌مشی‌گذاری، توسعه بین المللی، تجارت و غیره مورد استفاده قرار می‌گیرند تا حدی که بعضا انجام ندادن آنها کاری غیرمعمول و اقدامی بی‌پروا تلقی می‌شود [3]. در این بخش به برخی از ویژگی‌های RCTها می‌پردازیم که به نظر می‌رسد سبب شده تا اجرا و بکارگیری RCTها تا این اندازه گسترش یابد. پنج ویژگی کارآزمایی‌های کنترل‌شده تصادفی در ادامه مطرح می‌شوند:

4-1. کم هزینه بودن و مقرون به صرفه بودن RCT

اجرای RCTها عمدتا هزینه زیادی در پی ندارد. البته باید گفت هزینه‌های اجرای RCT به نحوه طراحی آن‌ها نیز بستگی دارد. با برنامه ریزی اصولی می‌توان RCTهایی با هزینه پایین طراحی کرد. این امر به ویژه زمانی صادق است که یک RCT بر یک بستر از پیش موجود اجرا شود. هم‌چنین زمانی که از داده‌هایی استفاده می‌شود که به طور عادی در سیستم‌ها ثبت می‌شوند، هزینه‌ها کاهش می‌یابد. البته از جهت اینکه نتیجه RCT می‌تواند نشان دهد که یک خط‌مشی‌ یا برنامه ارزش هزینه کلان کردن دارد یا خیر، هزینه کردن برای اجرای RCT قطعا مقرون به صرفه خواهد بود زیرا می‌تواند از صرف هزینه و بودجه در محل‌های ناکارآمد جلوگیری کند و یا همچنین کمک کند بین چند برنامه موثر، بودجه به کارآمدترین برنامه تخصیص یابد. به طور کلی بهتر است به جای در نظر گرفتن هزینه‌های اجرای یک RCT به هزینه‌های عدم اجرای RCT توجه کرد [3]. تجربیات جهانی نشان داده است که حتی مهمترین و بزرگترین برنامه‌های اجتماعی و خط‌مشی‌ را می‌توان با صرف حداکثر ۱۰۰ هزار دلار انجام داد. طبق این تجربیات در صورتی که حداکثر ۲ درصد از بودجه هر برنامه و خط‌مشی‌ به ارزیابی اثربخشی آن پیش از اجرا تخصیص داده شود، بودجه و منابع بسیار عظیمی برای برنامه‌های غیر موثر اتلاف نخواهد شد [15].

4-2. سرعت قابل قبول اجرای RCT

ارزیابی را با نتایج گوناگون یک مداخله می‌توان سنجید. برای مثال اگر هدف یک مداخله ارتقای سطح تحصیلات در یک منطقه باشد، برای ارزیابی نتایج مداخله می‌توان قصد افراد برای کسب تحصیلات بیشتر، ثبت نام بیشتر در مدرسه یا دانشگاه و یا فارغ التحصیلی در مدرسه یا دانشگاه را سنجید. در واقع ممکن است برخی نتایج برای آشکار شدن به چند سال زمان نیاز داشته باشند. لذا سرعت اجرای RCT وابسته به معیاری است که برای سنجش اثربخشی نتیجه یک مداخله انتخاب شده است که در نتایج طولانی مدت طبیعتا هر ارزیابی آینده همان میزان زمان را برای آشکار شدن نیاز دارد. البته این نکته نیز قابل ذکر است که همیشه نیاز نیست نتایج طولانی مدت سنجیده شود. در مواردی که نتایج کوتاه مدت یا میان مدت ارتباط نزدیکی با نتایج بلند مدت دارد، می‌توان از آنها استفاده کرد و پاسخ سریع‌تری از نتایج RCT دریافت کرد [15]. برای مثال طرح حرکت به سمت فرصت، نمونه‌ای است که نشان می‌دهد نتایج کوتاه مدت اثربخشی قابل قبولی نداشتند اما در نتایج بلند مدت شواهدی مبنی بر اثربخشی طرح وجود داشت. اواسط دهه ۱۹۹۰ در آمریکا یک مداخله با عنوان حرکت به سمت فرصت، به خانواده‌های کم‌درآمد یارانه مسکن برای کمک به نقل مکان به مناطق ثروتمندتر داده می‌شد. نتایج حاصل از این مداخله در ابتدا کمی نا‌امید کننده بود زیرا نمرات آزمون‌های تحصیلی فرزندان این خانواده‌ها به طور قابل توجهی بهبود نیافته بود. اما شواهد طولانی مدت‌تر نتایجی متفاوت را نشان می‌داد. در سال ۲۰۱۵ RCTهایی بر روی این نمونه انجام شد. نتایج در سال ۲۰۱۵ و وقتی این کودکان حدودا ۲۰ ساله شده بودند، نشان داد کودکانی که زیر ۱۳ سال به مناطق مرفه‌تر نقل مکان کرده بودند، نرخ حضور در دانشگاه بالاتری به نسبت گروه کنترل داشتند، درآمدشان ۳۱ درصد بیشتر از گروه کنترل بود، در محله‌های بهتری در بزرگسالی زندگی می‌کردند و احتمال کمتری داشت تک والد باشند. لذا این RCT نشان داد فراتر از نتایج فوری و کوتاه مدت، می‌توان نتایج بلندمدت مداخلات و خط‌مشی‌‌ها را نیز ارزیابی کرد و این به قدرت بیشتر سیاستگذاران در تشخیص برنامه‌ها و خط‌مشی‌‌های موثر کمک می‌کند [6]و [۱5].

4-3. ساده بودن و سهولت اجرای RCT

طراحی و اجرای RCTها عمدتا پیچیده یا دشوار نیستند. البته برای طراحی و اجرای با سهولت بیشتر آنها پشتیانی متخصصان و نیز همکاری مسئولین اجرایی مورد نیاز است. در صورتی که در مرحله طراحی یک RCT تلاش اولیه‌ای برای اصولی پیش رفتن آن و بررسی جوانب در طراحی و اجرا صرف شود و این مورد در همکاری و تعامل بین متخصصان علمی و صاحب‌نظران و افراد با تجربه خط‌مشی‌گذاری و اجرایی انجام گیرد، اجرای آن با سهولت بیشتری انجام خواهد گرفت [3].

4-4. قابلیت تعمیم نتایج حاصل از RCT

با توجه به تفاوت‌های موقعیتی، فرهنگی، اقتصادی و غیره بین گروه‌های مختلف مردم یک جامعه و نیز تغییر شرایط در زمان‌ها و موقعیت‌های گوناگون، اعتبار خارجی ارزیابی‌ها و در واقع تعمیم پذیری آنها به طور کلی یک چالش است. اما با توجه به قابلیت‌های RCT می‌توان تا حد قابل قبولی تعمیم‌پذیری RCT‌ها را افزایش داد. یکی از اقدامات لازم افزایش تعداد نمونه است. در واقع هرچه اجرای RCT بر نمونه تعداد بیشتری از افراد و نیز با در نظر گرفتن تنوع آن‌ها در جامعه هدف انجام شود، نتایج RCT قابلیت تعمیم بیشتری پیدا می‌کند. برای مثال در صورتی که قصد سنجش اثربخشی یک طرح تشویقی بر روی صرفه‌جویی در مصرف انرژی وجود داشته باشد بهتر است نمونه‌ای که RCT بر روی آن‌ها می‌خواهد انجام شود شامل همه دهک‌های اقتصادی جامعه و یا همه استان‌های کشور باشد. همچنین RCTها قابلیت تکرار در حالات و شرایط گوناگون را دارند و می‌توان از این قابلیت استفاده کرد و یک RCT را در زمینه‌های گوناگون تکرار کرد و از این تکرار نتایج قابل تعمیمی برای کل جامعه به دست آورد [۱5].

4-5. قابلیت استفاده از RCT در شرایط پیچیده و در حال تغییر

از RCTها حتی در شرایط پیچیده و در حال تغییر و در چالش‌های اجتماعی و سیاستی دشوار می‌توان استفاده کرد. دانش تخصصی طراحی و اجرای RCT این امکان را فراهم کرده است تا با طراحی مدل‌های پیشرفته RCT مثل step wedge در شرایط پیچیده و یا در حال تغییر بتوان از RCTها برای ارزیابی اثربخشی برنامه‌ها استفاده کرد. تجربیات موفق جهانی نیز که در چنین حوز‌ه‌ها و یا شرایطی RCTهای موفقیت آمیز و مفیدی اجرا کرده اند نیز می‌توانند تایید کننده این ادعا باشند [۱5].

5.الزامات استفاده از ابزار کارآزمایی های تصادفی کنترل شده (RCTs)

کارآزمایی‌های تصادفی کنترل‌شده این ظرفیت را دارند که از نظر اقتصادی و خط‌مشی‌گذاری بینش‌های ارزشمندی را پیرامون فعالیت‌های حاکمیتی ارائه دهند. با این حال باید یک‌ سری شرایطی فراهم باشد تا بتوان RCTها را طراحی و اجرا کرد. ویژگی‌هایی که باید وجود داشته باشند تا قابلیت اجرای RCT در حوزه‌ای وجود داشته باشد عبارتند از:

1.برای نتایج اثربخش، معیارهای تعریف شده و قابل مشاهده وجود داشته باشد: برای اجرای یک RCT خوب لازم است تعریف عینی و مشخصی از اثربخشی وجود داشته باشد. یعنی پیش از اجرای یک RCT باید معیاری که موثر بودن یک مداخله را نشان می‌دهد تعریف شود و قابل مشاهده باشد [6]. برای مثال در سنجش اثربخشی طرح تشویقی فرزندآوری، یک معیار نتیجه‌ مناسب، تعداد فرزندان به دنیا آمده است که قابل مشاهده و ردیابی و اندازه‌گیری می‌باشد و یک معیار نتیجه‌ نامناسب میزان تمایل به فرزندآوری است که قابل مشاهده و سنجش عینی نیست.

2.جمعیت‌های مورد آزمایش (حجم نمونه) به اندازه کافی بزرگ باشد: RCTهای با نمونه کوچک قدرت آماری و استنباطی کافی را ندارند. برای تمایز آماری بین گروه‌های مداخله و کنترل، نیاز به تعداد زیادی شرکت کننده در آزمایش وجود دارد [6]. انجمن AEA آمریکا نشان داده است که اکثر RCTهای سیاستی و اجتماعی بین ۱۰۰۰ تا ۱۰۰۰۰ شرکت کننده دارد. هر چند که RCTهای با نمونه‌های کوچکتر نیز عملی هستند اما هر چه تعداد نمونه بیشتر باشد، قدرت RCT و استنباط نتایج از آن بیشتر می‌شود. در سطوح مختلفی می‌توان از جمعیت نمونه گرفت برای مثال نمونه می‌تواند در سطح فرد، خانواده، گروه‌ها و حتی مناطق جغرافیایی باشد. برای داشتن حجم نمونه کافی می‌توان در سطوح نمونه تغییراتی ایجاد کرد [6].

3.داده‌های خوب و مناسب در حوزه مورد ارزیابی وجود داشته باشد: برخی از حوزه‌های سیاستی، به لحاظ داده‌های در دسترس و مورد علاقه سیاستگذاران، غنی هستند (مانند مالیات، بهداشت و آموزش) در حالی که در برخی حوزه‌ها و مسائل داده‌های ثبت شده کمتری وجود دارد (مثل بی‌خانمانی یا برخی آسیب‌های فرهنگی). RCTها در شرایطی که به داده‌های با کیفیت بیشتری دسترسی وجود داشته باشد، عمدتا ًبه سهولت و با کیفیت بیشتری انجام می‌شوند[6].

4.مداخلات مورد استفاده استاندارد وجود داشته باشد: برای اینکه RCTها شواهد معنی داری در مورد اثربخشی ارائه دهند، همه شرکت کنندگان در گروه مداخله باید یک مداخله استاندارد و یکسان را در طول کارآزمایی دریافت کنند. مداخلاتی که استانداردسازی آن‌ها دشوار است، ذاتاً برای سنجش اثربخشی دشوار هستند. برای مثال اجزای یک طرح تشویقی و نحوه ارائه آن باید برای تمام افراد گروه مداخله یکسان باشد. در صورتی که مداخله استاندارد و یکسان نباشد، نمی‌توان نتیجه گیری کرد که اثر مشاهده شده به علت اجرای مداخله بوده است. همچنین اگر در طول کارآزمایی، مداخله تغییراتی داشته باشد نمی‌توان متوجه شد که کدام بخش از مداخله موثر و کدام بخش غیرموثر بوده است [6].

5. زیرساخت‌های مناسب و افراد مسئول آگاه هر دو وجود داشته باشند: برای اجرای RCTهای موفق به دو عامل همزمان نیاز است. اولین عامل زیرساخت‌های مورد نیاز جهت اجرای RCT و دومین عامل افراد ذی‌ربط و مسئولین و دست‌اندکاران آگاه و همراه است. در برخی سازمان‌ها و یا حوزه‌ها به دلیل بروکراسی‌های فراوان، زیرساخت‌های ضعیف و قدیمی امکان اجرای مداخلات و سنجش اثربخشی‌ها بسیار دشوار است و هرچه این زیرساخت‌ها بهتر فراهم‌ باشد، با قوت بیشتری می‌توان RCT‌ها را اجرا کرد. همچنین فراتر از زیرساخت‌ها، به مسئولین و افرادی نیز در نهادها نیاز است تا به ارزش RCT‌ها و اهمیت آنها در فرایند خط‌مشی‌گذاری آگاه باشند و افرادی توانمند و با انگیزه برای کمک به اجرای RCTها باشند [6].

در این بخش به پنج ویژگی برای اجرای موفقیت‌آمیز RCTها اشاره شد. اما این نکته نیز ضروری است که در برخی موضوعات یا حوزه‌های سیاستی استفاده از RCTها غیرممکن و نامناسب است که در این موارد باید از روش‌های ارزیابی دیگر استفاده کرد. دو عاملی که اغلب استفاده از RCTها را منع می‌کنند عبارتند از عدم امکان داشتن گروه کنترل و حجم نمونه خیلی کوچک. در برخی موضوعات جدا کردن گروه کنترل اصلا امکان پذیر نیست و یا غیراخلاقی است. برای مثال سود وام بانکی را نمی‌توان برای گروه مداخله متفاوت از گروه کنترل تعیین کرد و لذا نمی‌توان دو گروه مداخله و کنترل داشت. همچنین در برخی موارد جامعه هدف بسیار کوچک است و نمی‌توان از آن جامعه کوچک نمونه به اندازه کافی بزرگ گرفت و آن را تخصیص تصادفی داد. مثلا در شرایطی که هدف ما بررسی اثربخشی مداخله بر روی والدین روستایی باشد که فرزندی به سرپرستی گرفته اند. لذا علیرغم کاربردهای بسیار زیاد این روش، توجه به این محدودیت‌ها نیز مهم است [6].

6.راهنمای عملی استفاده از ابزار کارآزمایی های تصادفی کنترل شده (RCTs)

با همراهی متخصصان، حمایت مسئولان و خط مشی گذاری مناسب، راه اندازی RCTها بسیار کم هزینه تر و ساده تر هستند از آنچه اغلب تصور میشود. در این بخش مراحلی مطرح میشود که برای راه اندازی هر RCT لازم است. این مراحل طبق چارچوب «آزمایش، یادگیری و تطبیق» تیم بینشهای رفتاری انگلستان (BIT)معرفی میشود که در سال 2۰12 ارائه شد. طبق این چارچوب، ۹مرحله جداگانه در اجرای یک RCTوجود دارد که در این بخش تشریح میشود. همچنین به حوزه هایی اشاره خواهد شد که در آن سیاستگذار ممکن است بخواهد به دنبال مشاوره تخصصی بیشتر باشد [3].

آزمایش

مرحله ۱: دو یا چند مداخله خط‌مشی‌ را برای مقایسه شناسایی و انتخاب کنید.

زمانی که عدم اطمینان پیرامون اثربخشی دو یا چند مداخله وجود دارد، RCTها انجام می‌شوند. در واقع مبنای اصلی RCTها مقایسه مداخلات با یکدیگر است. اغلب RCTها در جهان نیز برای مقایسه یک مداخله و برنامه جدید در برابر برنامه فعلی انجام می‌شود. این مداخله جدید می‌تواند یک تغییر کوچک یا مجموعه‌ای از تغییرات کوچک در عملکرد فعلی باشد یا می‌تواند یک برنامه کاملا جدید باشد که در کشور یا زمینه‌ای دیگر موفق عمل کرده و یا دارای پشتوانه نظری مناسبی است. در این مرحله این نکته نیز حائز اهمیت است که مداخله‌ای که برای اجرای RCT انتخاب می‌شود نباید یک مداخله خط‌مشی‌ ایده آل و بی‌نقص باشد و باید دقیقا همان مداخله‌ای باشد که در صورت نشان دادن نتایج اثربخش بناست در مقیاس کل کشور اجرا شود.

مرحله ۲: نتیجه‌ای را که مداخله خط‌مشی‌ قصد دارد بر آن تاثیر بگذارد و نحوه سنجش آن در آزمایش را تعریف کنید.

در هر RCT بسیار مهم است که در همان ابتدا بدانیم دقیقا به چه نتیجه‌ای می‌خواهیم دست بیابیم و چگونه بناست آن نتیجه را اندازه‌گیری کنیم. برای مثال در یک خط‌مشی‌ کنترل مصرف انرژی، معیار نتیجه می‌تواند میزان مصرف خانگی انرژی باشد. در این مرحله مهم است پیش از اجرای RCT در مورد چگونگی و زمان اندازه‌گیری نتایج تصمیم‌گیری کنیم و در مرحله تحلیل نتایج به آن پایبند باشیم. همچنین بسیار مهم است که اطمینان حاصل شود که روش اندازه‌گیری نتایج برای همه گروه‌ها دقیقا یکسان است. علاوه بر این در هنگام تصمیم گیری پیرامون معیار نتیجه این مهم است که نتیجه‌ای را که واقعا به آن اهمیت می‌دهید انتخاب کنید و در واقع نتیجه قابل سنجش هر چه به هدف واقعی نزدیک‌تر باشد بهتر است. اما در صورتی که هدف نهایی قابل سنجش نباشد، می‌تواند از «نتیجه جایگزین» استفاده کرد. برای مثال در ارزیابی یک خط‌مشی‌‌ که هدف کاهش ارتکاب جرم را دارد، شاید میزان واقعی ارتکاب جرم را پس از اجرای مداخله نتوان سنجید و در عوض میزان افراد دستگیر شده پس از ارتکاب جرم را به عنوان نتیجه جایگزین انتخاب کرد. این سوال که در هر RCT کدام معیار نتیجه مناسب‌تر است بهتر است از تعامل بین متخصصین RCT (که می‌دانند چه نتیجه‌ای از نظر فنی و تخصصی مناسب‌تر است) و نیز سیاستگذاران (که می‌دانند چه نوع داده‌ای قابل دسترس‌تر است و هزینه جمع‌آوری آن کمتر است) حاصل شود.

مرحله ۳: پیرامون واحد تصادفی سازی تصمیم‌گیری کنید.

پس از بررسی اینکه چه نتیجه‌ای را اندازه‌گیری کنیم، باید تصمیم بگیریم که چه کسی یا چه چیزی را تصادفی کنیم. این موضوع به عنوان واحد تصادفی سازی شناخته می‌شود. واحد تصادفی سازی اغلب افراد هستند. برای مثال زمانی که خط‌مشی یا برنامه‌ای را برای پایبندی بیشتر به قانون حجاب ارزیابی می‌کنیم. با این حال، واحد تصادفی سازی می‌تواند گروهی از افراد یا موسسات نیز باشد. برای مثال زمانی که قصد ارزیابی طرحی را برای افزایش پرداخت مالیات شرکت‌ها داریم که در این شرایط واحد تصادفی‌سازی می‌تواند شرکت‌ها باشد. در نهایت واحد تصادفی سازی حتی می‌تواند مناطق جغرافیایی باشد. برای مثال زمانی که مداخله‌ای را برای تشویق مردم به بازیافت زباله می‌خواهیم مورد ارزیابی قرار دهیم، واحد تصادفی‌سازی ما می‌تواند مناطق شهری باشد. این سوال که در هر RCT واحد تصادفی سازی بهتر است افراد، موسسات یا مناطق باشد، معمولا بستگی به ملاحظات عملیاتی آن کارآزمایی دارد که مشاوره با یک متخصص می‌تواند در این زمینه کمک کننده باشد.

مرحله ۴: تعیین کنید چه حجم نمونه‌ای برای دریافت نتایج قوی مورد نیاز است.

برای نتیجه‌گیری اثربخشی یک خط‌مشی‌ از RCTها، کارآزمایی باید با حجم نمونه کافی اجرا شود. اگر حجم نمونه به اندازه کافی بزرگ باشد، می‌توانیم مطمئن باشیم که اثر مداخله بعید است دلیل شانس بوده باشد. اگر واحد تصادفی سازی موسسات یا مناطق باشد، به احتمال زیاد به حجم نمونه بیشتری نیاز خواهیم داشت. محاسبات آماری در تعیین اینکه چه حجم نمونه‌ای مورد نیاز است تا گروه‌های مداخله و کنترل مورد بررسی قرار گیرند، کمک می‌کند. این محاسبات می‌تواند با کمک متخصصین RCT انجام شود. این نکته نیز قابل ذکر است که اگر مداخله اثرات بزرگی داشته باشد، آزمایش با نمونه کمتر نیز می‌تواند اثرات را نشان دهد (اندازه اثر بزرگ) اما برای تشخیص اثرات و تفاوت‌های ظریف‌تر به تعداد بیشتری نمونه نیاز است (اندازه اثر کوچک). با توجه به اینکه اکثر مداخلات خط‌مشی‌، اندازه اثرهای کوچک دارند و نیز با توجه به اینکه گاهی تشخیص حتی تفاوت‌های کوچک بسیار مفید است، پیشنهاد می‌شود در صورت عدم افزایش زیاد هزینه، حجم نمونه بزرگتری انتخاب شود.

مرحله ۵: هر واحد را با استفاده از روش تصادفی‌سازی به یکی از مداخلات خط‌مشی‌ اختصاص دهید.

تخصیص تصادفی واحدهای مطالعه به گروه‌های مداخله و کنترل، گام کلیدی است که RCT را نسبت به سایر انواع ارزیابی خط‌مشی‌ برتری می‌دهد. این کار ما را قادر می‌سازد تا مطمئن باشیم که گروه مداخله و کنترل در همه خصوصیت‌ها معادل یکدیگر هستند. به عنوان مثال در زمینه خط‌مشی‌‌های آموزشی این خصوصیت‌ها می‌تواند شامل وضعیت اجتماعی-اقتصادی، جنسیت و غیره باشد. روش‌های تخصصی زیادی برای این تخصیص تصادفی وجود دارد که در اختیار متخصصان است.

مرحله ۶: مداخلات خط‌مشی‌ را به گروه‌های اختصاص داده شده ارائه کنید.

هنگامی که طبق مراحل قبل افراد، موسسات یا مناطق به طور تصادفی به یک گروه مداخله و کنترل تخصیص داده شدند، زمان آن است که مداخله خط‌مشی‌ را به آن‌ها ارائه کنیم (برای مثال طرح تشویقی فرزندآوری را به افراد گروه مداخله معرفی کنیم). یکی از ملاحظات مهم در این مرحله، وجود سیستمی برای نظارت بر مداخله است تا اطمینان حاصل شود که به روشی مطلوب، استاندارد و یکسان، مداخله به همه آنها ارائه شده است.

یادگیری

مرحله ۷: نتایج را اندازه‌گیری کنید و تاثیر مداخله خط‌مشی‌ را تعیین کنید.

پس از ارائه مداخله باید نتایج را اندازه‌گیری کنیم. زمان و روش اندازه‌گیری نتایج در مرحله ۲ تصمیم‌گیری شده بودند. این زمان بستگی به این دارد که فکر کنیم مداخله با چه سرعتی می‌تواند اثرگذار باشد که برای هر مداخله متفاوت است. برای مثال اگر مداخله به صورت پیامکی است، باید که صبح انتخابات برای مردم ارسال می‌شود تا تشویق به مشارکت در انتخابات شوند، طبیعتا این مدت زمان ۲۴ ساعت است و پس از آن می‌توان نتایج را اندازه‌گیری کرد اما در صورتی که مداخله مربوط به تشویق فرزندآوری باشد حداقل یک سال می‌توان بازه اندازه‌گیری نتایج را معین کرد. همچنین این نکته نیز قابل ذکر است که علاوه بر جمع آوری داده‌های مربوط به نتیجه اصلی، جمع آوری داده‌های فرایندی و سایر داده‌های جانبی حاصل از مداخله نیز می‌تواند مفید باشد و به توضیح نتایج کمک کند و یا بینش‌های جدیدی ارائه دهد. این یافته‌های ثانویه را نمی‌توان با همان قطعیت نتایج اصلی تفسیر کرد اما می‌توان از آنها برای ایجاد فرضیات جدید برای کارآزمایی‌های بعدی استفاده کرد. علاوه بر این بسیاری از کارآزمایی‌ها شامل جمع آوری داده‌های کیفی برای کمک به توضیح یافته‌ها، حمایت از اجرای آینده، راهنمای تحقیقات بیشتر و یا بهبود مداخله هستند. این مورد ضروری نیست اما در صورت انجام تحقیقات کیفی شرایط ایده آلی ایجاد می‌شود زیرا ممکن است با این کار اطلاعات بیشتری در دسترس قرار گیرد.

تطبیق

مرحله ۸: مداخله خط‌مشی‌ را طبق نتایج به دست آمده، تطبیق دهید.

به دست آوردن نتایج مثبت از اثربخشی مداخلات عموما قابل قبول‌تر از به دست آوردن نتایج منفی و یا بی نتیجه بودن اثر مداخلات است. یعنی عمدتا افراد انتظار دارند مداخله موثر باشد تا اینکه بی اثر باشد یا اثر منفی داشته باشد. اما این نکته قابل توجه است که کارآزمایی که بی اثر بودن یا اثر منفی مداخله را نشان می‌دهد به همان اندازه ارزشمند است که اثربخش بودن مداخله را نشان دهد. برای مثال اگر بفهمیم ارائه مزایای بیمه سبب بهبود سلامت افراد نمی‌شود (یعنی نتیجه کارآزمایی بی اثر باشد) می‌توانیم منابع عمده حاکمیت را صرف کاری نکنیم که بی اثر است و هزینه‌های گزافی نیز به بار می‌آورد. لذا در مداخلاتی که نشان داده شده بی اثر هستند، می‌توان سرمایه گذاری بر روی آنها را غیرمنطقی در نظر گرفت و بودجه پس انداز شده را در جای دیگر و بر روی مداخلات موثرتر هزینه کرد. همچنین در این مرحله لازم است یافته‌های حاصل از کارآزمایی ثبت و منتشر شوند تا سایر نهادهای دولتی نیز از نتایج آن بتوانند استفاده کنند.

مرحله ۹: به مرحله اول بازگردید تا به طور مداوم درک خود را از آنچه موثر است را بهبود بخشید.

به جای اینکه RCT را ابزاری برای ارزیابی یک برنامه مشخص در یک مقطع زمانی معین بدانیم، بهتر است که RCTها را به عنوان بخشی از فرآیند مستمر نوآوری و بهبود خط‌مشی‌‌ها در نظر بگیریم. تکرار نتایج یک کارآزمایی به ویژه در زمانی مهم است که مداخله را بخواهیم در زمانی دیگر و یا به جمعیتی دیگر ارائه کنیم. همچنین استفاده از یافته‌های آزمایشی مستمر برای شناسایی راه‌های جدید برای بهبود دائمی نتایح مفید است. همچنین انجام مستمر RCTها برای تشخیص اینکه کدام یک از جنبه‌های یک خط‌مشی‌ موثرتر است، می‌تواند مفید باشد. بهبود مستمر خط‌مشی‌‌ها مهمترین جنبه روش شناسی چارجوب «آزمایش، یادگیری و تطبیق» است زیرا فرض می‌کند همیشه فضا برای بهبود کارآمدی خط‌مشی‌‌ها وجود دارد و هرگز ما آگاه به تمام زوایای حوزه‌های سیاستی و رفتار مردم نیستیم.

7.ضرورت ظرفیت‌سازی در راستای کاربست کارآزمایی‌های‌تصادفی کنترل‌شده (RCTs)

در زمانی که نهادهای حکمرانی شروع به استفاده از RCTها کردند، به این نکته باید توجه شود که نباید در یک RCT متوقف شد و باید جریانی از RCTها ایجاد کرد و در واقع اکوسیستم شواهد را در کشور پایه گذاری کرد و به شواهد به شکل جزء جداناشدنی از فرایند خط‌مشی‌گذاری نگریست. همچنین به طور کلی باید یافته‌های مثبت و منفی RCTها را پذیرفت زیرا مجموعه آن نتایج است که حاکمیت نیاز دارد تا به طور موثر اولویت‌ها و تصمیم‌گیری‌های خط‌مشی‌ را از آنچه ناکارآمد و غیر موثر است به آنچه موثر و اثربخش و کارآمد است، تغییر دهد [6].

فرصت‌های اجرای RCT فراوان هستند اما تبدیل شدن اجرای RCTها در کشور به عنوان یکی از بخش‌های ضروری فرایند خط‌مشی‌گذاری نیازمند ایجاد ظرفیت و فراهم شدن شرایط لازم است. در این بخش سه ظرفیت حیاتی را برای استفاده از این فرصت‌ها مطرح می‌کنیم. در واقع اگر این سه ظرفیت فعال شوند، می‌توان امید داشت که در حکمرانی کشور از شواهد به نحو موثر استفاده خواهد شد. این سه ظرفیت شامل فرهنگ و رهبری، تجربه و تخصص و نهایتا شفافیت است. در ادامه به هر یک جداگانه به صورت مختصر پرداخته می‌شود:

7-1. فرهنگ و رهبری

بررسی‌های جهانی نشان داده اند که بزرگترین ظرفیت ایجاد کننده خط‌مشی‌گذاری مبتنی بر شواهد، فرهنگ سیاسی و رهبری است. RCTها نیازمند فرهنگی هستند که طبق آن سیاستگذاران باور داشته باشند که با شهود نمی‌توان به کارآمدی یا عدم کارآمدی خط‌مشی‌‌ها، برنامه‌ها و مداخلات پی برد. طبق گفته دیوید هالپرن، فرهنگ سیاسی و سیاستگذاران باید به گفتن «نمی‌دانیم اما می‌دانیم چطور می‌شود فهمید» عادت کنند. در واقع فرهنگ سیاسی باید به این باور برسد که هر چند به صورت شهودی نمی‌دانیم چه چیزی کارآمد است اما می‌توانیم آزمایش کنیم، یاد بگیریم و تطبیق دهیم و این فرایند را با سرعت به سرانجام برسانیم. برداشتن اولین قدم برای شروع خط‌مشی‌گذاری شواهد محور نیاز به اعتماد دارد. نهادها باید اعتماد کنند که مسئولین از آنها حمایت خواهند کرد تا بتوانند از آزمایش‌ها درس بگیرند. مسئولین نیز باید اعتماد کنند که شکست سریع و کوچک هوشمندانه‌تر است به نسبت اینکه وانمود کنند که شکست غیر ممکن است. شهروندان نیز باید اعتماد کنند که حاکمیت از این آزمایش‌ها درس خواهد گرفت و به سمت بهبود خط‌مشی‌‌ها حرکت خواهد کرد.

نکته قابل توجه بعدی این است که ایجاد خط‌مشی‌گذاری شواهد محور نیاز زیاد به حمایت مسئولین حاکمیتی دارد. دستورالعمل‌هایی که انجام RCT را جزء جداناشدنی ‌از فرایند خط‌مشی‌گذاری می‌دانند، تخصیص بودجه برای انجام RCTها پیش از تصمیم‌گیری‌های نهایی، دادن مجوزها و دسترسی‌های لازم برای انجام RCTها همه صرفا بر عهده مسئولین است تا این رویکرد خط‌مشی‌گذاری شواهد محور در حکمرانی کشور مورد استفاده قرار بگیرد. نهایتا مهمترین عامل ایجاد ظرفیت برای رویکرد خط‌مشی‌گذاری شواهد محور، شوق و تعهد مسئولین است که RCTها را جزو اصلی ترین ورودی‌ها و مبناهای خود برای تصمیم‌گیری‌ها و خط‌مشی‌گذاری‌ها بدانند [6].

7-2. تجربه و تخصص

استفاده از تجربه و تخصص افراد با تجربه و متخصص در زمینه روش‌های شواهد محور و RCTها یکی از ظرفیت‌های مهم برای ایجاد رویکرد خط‌مشی‌گذاری شواهدمحور در کشور است. با توجه به اینکه انجام RCTها نیاز به تجربه و تخصص دارد، همچنین با توجه به تجربیات جهانی بکارگیری خط‌مشی‌گذاری شواهد محور پیشنهاد می‌شود که مراکزی به صورت متمرکز مسئولیت و نقش ارائه خدمات مرتبط با ارزیابی‌های خط‌مشی‌‌ها و RCTها را برعهده بگیرند. این مراکز متمرکز چند وظیفه برعهده دارند. اولاً استانداردهای ارزیابی واحدی را در سراسر حاکمیت تعیین و ایجاد می‌کنند که بار را برای بخش‌های جداگانه که قصد انجام دارند کاهش می‌دهد و احتمال ارزیابی‌های بی‌کیفیت را پایین می‌آورد؛ ثانیاً این مراکز خط‌مشی‌گذاری مبتنی بر شواهد را ترویج می‌کنند و بر آنها نظارت‌ها و هماهنگی‌های لازم را انجام می‌دهند؛ ثالثا منابع مورد نیاز را اعم از تخصص فنی، سرمایه انسانی و غیره فراهم می‌کنند. علاوه بر اینها می‌توان گفت، به طور کلی این مراکز سه کارکرد دیگر را نیز بعهده دارند: تولید شواهد، ترجمه شواهد و تسهیل جذب شواهد. این مراکز به تولید و نیز جمع آوری شواهد از سراسر جهان مشغول هستند و سپس شواهد تولید شده و یا ترکیب شده را طبق نیاز خط‌مشی‌گذاری و مسائل آن ترجمه می‌کنند و با معیارهای مشترک ارزش آنها را معین می‌نمایند و نهایتاً جذب شواهد توسط نهادهای خط‌مشی‌گذاری را تسهیل می‌کنند؛ یعنی کمک می‌کنند تا شواهد به دست مسئولین و سیاستگذارانی که به آن‌ها نیاز دارند برسد و آنها را در تصمیم‌گیری‌ها بکار ببرند [7].

طبق تجربیات جهانی این مرکز متمرکز می‌تواند در قالب ساختارهای متفاوتی فعالیت کند. برخی از این مراکز ذیل نهادهای حاکمیتی و وابسته به آن‌ها مشغول به فعالیت هستند و کارمندان آنها کارمندان دولت هستند و با یک ستاد مرکز به یکدیگر متصل هستند و در واقع شبکه‌ای از کارشناسان و منابع را فراهم می‌کنند و نیازهای ارزیابی و شواهدمحوری نهادهای حاکمیتی را رفع می‌کنند. نوع دوم مراکز متخصص و متمرکز کاملا مستقل از حاکمیت هستند که از بخش‌های مختلف حاکمیت جهت ارزیابی خط‌مشی‌ها سفارش دریافت می‌کنند. در نوع سوم مرکزی متمرکزی وجود ندارد و هر بخش حاکمیت بسته به نیازهای ارزیابی به صورت پراکنده متخصصین، کارشناسان و مشاورین را به کار می‌گیرد و نیازهای مرتبط را بدین صورت رفع می‌نماید. نهایتا فارغ از تاسیس مراکز متمرکز با مسئولیت اجرای رویکرد شواهد محور، مشارکت دانشگاهیان نیز برای ظرفیت سازی این رویکرد بسیار مهم است. با ایجاد روابط قابل اعتماد بین حاکمیت و جامعه دانشگاهی، دسترسی به منبع بزرگی از دانش ارزیابی خط‌مشی‌ ارتقا می‌یابد [6].

7-3. شفافیت

عدم شفافیت ارزیابی‌ها، اعتبار آنها را کاهش می‌دهد. به طور کلی بدبینی قابل پیش بینی در مورد ارزیابی حاکمیت از خط‌مشی‌‌های خود وجود دارد. یکی از راه‌حل‌های این مورد، ایجاد شفافیت و ثبت نتایج کارآزمایی‌ها و ارزیابی‌های خط‌مشی‌‌ها است. این رویکرد مستلزم آن است که سیاستگذاران برای نشان دادن تاثیرات کم یا عدم تاثیر برنامه‌ها آماده باشند. تحلیل نتایج پایگاه داده مرکز What Works بنیاد وقف آموزش انگلستان نشان داد که از ۴۵ کارآزمایی اجرا شده تنها ۱۱ کارآزمایی دارای نتیجه مثبت و از نظر آماری معنی دار بودند. مرکز SBST آمریکا نیز تمام کارآزمایی‌های با نتایج منفی یا بی‌تاثیر خود را منتشر می‌کند. نکته مهم این است که انتشار این نتایج به اندازه انتشار نتایج مثبت مهم است. دانستن اینکه چه کاری نباید انجام شود به اندازه دانستن اینکه چه کاری باید انجام شود، مفید است. ثبت نتایج علاوه بر افزایش اعتبار نتایج سبب می‌شود تا بخش‌های مختلف حاکمیت به نتایج آزمایش‌ها دسترسی داشته باشند و برای سایر کارهای خود بتوانند از آنها استفاده کنند. در واقع هرچه مجموعه داده‌های موجود با یکدیگر پیوستگی و پیوند بیشتری داشته باشند و نهادهای مختلف به شبکه آن شواهد دسترسی بیشتری داشته باشند، ظرفیت گسترش رویکرد خط‌مشی‌گذاری شواهد محور افزایش پیدا می‌کند [6].

8.کاربست کارآزمایی‌های تصادفی کنترل شده (RCTs) در مجلس شورای اسلامی

8-1. کارآزمایی‌های تصادفی کنترل شده (RCTs) در اسناد و قوانین بالادستی

امروزه در سطح جهان قانونگذاری شواهد محور و کاربرد RCTها در خط‌مشی‌گذاری و قانونگذاری در حال گسترش است و از طرفی فشار فزایند‌ه‌ای در نهادهای حکمرانی وجود دارد تا نشان دهند خط‌مشی‌ها و قوانین، اثربخش هستند. این تلاش برای اثبات اثربخشی خط‌مشی‌گذاری‌ها می‌تواند سبب افزایش کارآمدی و مسئولیت پذیری در سطح حکمرانی شود. قانونگذاران در کشورهای مختلف برای ترویج رویکرد شواهد محور و استفاده از کارآزمایی‌های تصادفی کنترل شده، قوانینی وضع می‌کنند و ساختارها و فرایندهایی ایجاد می‌کنند تا این رویکرد در حکمرانی آنها با سهولت بیشتری مورد استفاده قرار گیرد. برای نمونه در آمریکا قوانینی با ۵ رویکرد وضع شد تا خط‌مشی‌گذاری و قانونگذاری مبتنی بر شواهد را ارتقا دهد. این ۵ رویکرد عبارت اند از: ۱- طبقه بندی برنامه‌ها بر اساس شواهد موجود توسط نهادهای تخصصی وابسته ۲- ایجاد انگیزه برای استفاده از برنامه‌های مبتنی بر شواهد و تحقیق ۳- محدود کردن بودجه برنامه‌های بی اثر طبق نتایج شواهد ۴- نیاز به استفاده از برنامه‌های مبتنی بر شواهد و تحقیق ۵- تخصیص بودجه به برنامه‌های مبتنی بر شواهد و تحقیق [۱7]. بنابراین طبق تجربیات جهانی، کاربست رویکرد شواهد محور و استفاده از کارآزمایی‌های تصادفی کنترل شده نیاز به طراحی راهبردی و برنامه ریزی دارد تا بتواند در نظام قانونگذاری ایران نیز ترویج شود.

علاوه بر تجربیات جهانی از خط‌مشی‌گذاری حول ترویج رویکرد شواهد محور و کاربست کارآزمایی‌های تصادفی کنترل شده، در اسناد بالادستی کشور نیز می‌توان مویداتی بر اهمیت استفاده از این رویکرد پیدا کرد. بند نهم «سیاست‌های کلی نظام قانون گذاری» مطرح می‌کند: «رعایت اصول قانونگذاری و قانون‌نویسی و تعیین سازوکار برای انطباق لوایح و طرح‌های قانونی با تاکید بر: ۱- قابل اجرا بودن قانون و قابل سنجش بودن اجرای آن ۲- معطوف بودن به نیازهای واقعی ۳- شفافیت و عدم ابهام ۴- استحکام در ادبیات و اصطلاحات حقوقی ۵- بیان شناسه تخصصی هر یک از لوایح و طرح‌های قانونی و علت پیشنهاد آن ۶- ابتناء بر نظرات کارشناسی و ارزیابی تأثیر اجرای قانون ۷- ثبات، نگاه بلندمدت و ملی ۸- انسجام قوانین و عدم تغییر یا اصلاح ضمنی آنها بدون ذکر شناسه تخصصی ۹- جلب مشارکت حداکثری مردم، ذی‌نفعان و نهادهای قانونی مردم‌نهاد تخصصی و صنفی در فرآیند قانون‌گذاری ۱۰- عدالت محوری در قوانین و اجتناب از تبعیض ناروا، عمومی بودن قانون و شمول و جامعیت آن و حتی‌الامکان پرهیز از استثناهای قانونی». لذا طبق بند نهم «سیاست‌های کلی نظام قانونگذاری» در قانونگذاری‌ها باید از قابل اجرا بودن قانون، قابل سنجش بودن قانون و ابتناء بر نظرات کارشناسی و ارزیابی تأثیر اجرای قانون اطمینان حاصل کرد و سازوکارهای لازم را جهت اعمال این موارد فراهم ساخت.

طبق اصل (۸۵) قانون اساسی، قانونگذار وضع قانون آزمایشی را امکان پذیر ساخته است. از آنجایی که قانون آزمایشی، قبل از قطعیت قانون و با مدت اعتبار محدودی اجرا می‌شود، حاکی از آزمون و خطا در امر تقنین است. در واقع قانون آزمایشی به مدت محدود اجرا می‌شود تا با آزمون و خطا نقاط ضعف و قوت آن استخراج گردد و اثربخشی آن ارزیابی شود تا در نهایت در خصوص سرنوشت آن تصمیم گیری شود. نکته قابل ذکر این است که طبق توضیحاتی که پیشتر ارائه شد، در صورتی که ارزیابی انجام شده از اجرای قانون آزمایشی مبتنی بر آزمایش تصادفی و با گروه کنترل نباشد (RCT)، به لحاظ علمی نمی‌توان تاثیر مشاهده شده از اجرای قانون آزمایشی را به قانون نسبت داد زیرا هر چند این تاثیر مشاهده شده واقعی (و نه تحت تاثیر سوگیری خودتاییدی) باشد، اما می‌تواند تحت تاثیر سایر عوامل متعدد زمینه‌ای ایجاد شده باشد و بدین ترتیب نمی‌توان استنباط علّی انجام داد و تاثیر مشاهده شده را به قانون آزمایشی اجرا شده نسبت داد. بنابراین هر چند که قانونگذاری آزمایشی روشی مرسوم در جهان است و مزایای مخصوص به خود را دارد اما استفاده از روش کارآزمایی تصادفی کنترل شده می‌تواند در برخی موارد راه حل مکملی باشد که در موارد دارای ابهام به جای آزمون و خطا و دادن هزینه و اتلاف منابع و زمان، با اجرای قانون بر روی نمونه‌ای کوچکتر اما نماینده جامعه بتوان به اثربخشی و کارآمدی قانون پی برد و پیش از اجرا آن را ارزیابی نمود و نهایتا مبتنی بر شواهد به دست آمده پیرامون آن تصمیم گیری کرد.

نهایتا اینکه طبق ماده(۱۲۷) قانون «آیین نامه داخلی مجلس شورای اسلامی» لازم است طرح‌ها و لوایح پیشنهادی دارای دلایل توجیهی کافی باشند. از آنجایی که موثرین و دقیق ترین دلایل توجیهی اثربخشی طرح‌ها مبتنی بر کارآزمایی‌های تصادفی کنترل شده به دست می‌آیند، استفاده از این روش می‌تواند کمک بسزایی در تحقق این امر نماید. همچنین طبق ماده (۱۴۱)و (۱۴۲) این آیین نامه مرکز پژوهش‌های مجلس در تعاملی با کمسیون تخصصی به اظهار نظر کارشناسی می‌پردازد. یکی از مهمترین شواهد تخصصی بر اثربخشی و مطلوبیت طرح‌ها، نتایج کارآزمایی‌های تصادفی کنترل شده هستند. لذا مرکز پژوهش‌های مجلس می‌تواند با بکارگیری روش کارآزمایی تصادفی کنترل شده، نتایج متقنی را از اثربخشی و کارآمدی طرح‌ها و لوایح به کمسیون‌های تخصصی ارائه کند.

علاوه بر اسناد بالادستی ذکر شده، در دو گزارش پیشین مرکز پژوهش‌های مجلس تا حدی به مسئله قانونگذاری شواهد محور توجه شده است. گزارش اول با عنوان «راهکارهای کاهش سوگیری‌های شناختی به منظور ارتقای کیفیت تصمیم‌گیری مجلس شورای اسلامی» به سوگیری‌های شناختی موثر بر تصمیم‌گیری نمایندگان و راهکارهای مقابله با آن می‌پردازد. یکی از راهکارهای مطرح شده در این گزارش، شواهدمحور شدن راه‌حل‌ها و شفافیت آنها برای عموم مردم است. طبق گزارش، این توصیه سبب استفاده از شواهد در جهت خط‌مشی‌گذاری بهتر و کاهش سوگیری تأیید، می‌شود. همچنین برای رفع سوگیری خوش‌بینی، توصیه به طراحی آزمایش و انجام تغییرات در اجرای خط‌مشی شده‌است. منظور از این توصیه آن است که باید آزمایش‌هایی سریع و مستمر طراحی شود تا بازخورد اولیه‌ای در مورد واقعی بودن برنامه‌ها به نمایندگان ارائه دهد. برخی دیگر از توصیه‌ها نیز مرتبط با شواهدمحور بودن راه‌حل‌ها و بررسی اثرات و پیامدهای خط‌مشی‌ در اندازه کوچک پیش از اجرای آن در سطح کلان است [۲1]. در گزارش دیگر با عنوان «خط‌مشی‌گذاری هوشمند، رویکردی نوین ‌برای کارآمدسازی نظام تصمیم‌گیری و قانونگذاری کشور»، شش گام برای قانونگذاری هوشمند بیان می‌شود که عبارتند از: شناسایی مسائل سیاستی، تشخیص دادن، طراحی، پیاده‌سازی، آزمون و پالایش. این مراحل با مراحل انجام RCT مطرح شده در قبل همپوشانی‌هایی دارد. مشخصاً گام‌های چهارم و پنجم آن به آزمایش و سنجش و ارزیابی در خط‌مشی‌گذاری اشاره می‌کند. در گام چهارم یعنی پیاده‌سازی، راهکارهای ارائه شده، به‌صورت آزمایشی اجرا می‌شود تا پیچیدگی‌های موجود را تعدیل کرده و امکان‌پذیری طرح را قبل از اجرا در مقیاس کلان ارزیابی کنند. در گام پنجم یعنی آزمون، خط‌مشی‌ها و طرح‌های پیشنهادی به‌صورت میدانی آزموده شده و با استفاده از ابزارهای سنجش اثر، ارزیابی می‌شوند و در پایان با استفاده از اطلاعات به‌دست‌آمده بهترین راهکار بهبود برنامه و خط‌مشی مورد بررسی قرار می‌گیرد. ارزیابی هوشمند به این نکته تأکید دارد که فقط، یافته‌های ارزیابی نیستند که می‌توانند تأثیرگذار باشند؛ بلکه تصمیم برای ارزیابی، انتخاب روش و اینکه چگونه نتایج منتشر شوند میتواند اثرات بسیاری داشته باشد. تصمیم درباره‌ی هر یک از این موارد می‌تواند بر ارزیابی نهایی خط‌مشی اثرگذار باشد [19]. این گزارش چند پیشنهاد و توصیه‌ کاربردی براساس یافته‌های ناظر به هوشمندسازی خط‌مشی ارائه می‌کند که هر یک از آنها تا حدودی با حوزه‌ قانونگذاری شواهدمحور مرتبط است. مرتبط‌ترین آنها شامل این توصیه‌ها می‌شود: طراحی فرایند ارزیابی و پیش‌ارزیابی حین تدوین خط‌مشی‌ها و قوانین؛ کاربست اجرای آزمایشی و اجرای محدود قوانین و خط‌مشی‌ها پیش از اجرای آن در جامعه. مجموعا این گزارش ارتباط نسبتا نزدیکی با محتوای گزارش حاضر دارد و سعی در جا انداختن اهمیت قانونگذاری آزمایشی در فضای خط‌مشی‌‌گذاری و قانونگذاری دارد. دو گزارش مذکور به اهمیت آزمایش پیش از قانونگذاری و پیش از اجرای قانون در سطح کلان و برخی مزیت‌های روش آزمایشی و مراحل آن اشاره می‌کنند و اما آنچه در در این بین در رابطه با اعمال روش آزمایشی مطرح نشده، داشتن «گروه کنترل و تخصیص تصادفی به دو گروه آزمایش و کنترل» است. اساسا این دو ویژگی باعث تفاوت روش RCT با سایر روش‌ها و استاندارد طلایی‌ بودن آن است و این ویژگی‌هاست که به اعتبار روش RCT می‌افزاید. تاکنون در گزارش‌های مرکز پژوهش های مجلس شورای اسلامی به روش RCT و ویژگی‌های آن پرداخته نشده و گزارش حاضر قصد تبیین این روش و پر کردن این خلا را داشت.

8-2. پیشنهادات مرتبط با کاربست عملی کارآزمایی‌های تصادفی کنترل شده (RCTs)

در ادامه مبتنی بر نکات و مطالب بحث شده در این گزارش، پیشنهادها و توصیه‌هایی جهت ترویج و بکارگیری روش کارآزمایی تصادفی کنترل شده در فرایندهای مجلس شورای اسلامی ارائه می‌شود:

۱. بهترین راه برای ترویج و بکارگیری RCTها، شروع تلاش است. یادگیری از تجربه و کار بر روی RCTها منجر به توسعه بلندمدت قابلیت RCT می‌شود. هم RCTهای بهینه سازی و هم RCTهای سیاستی می‌توانند برای حکمرانی بسیار ارزشمند باشند. RCTهای بهینه سازی معمولا به نسبت RCTهای سیاستی تاثیرگذاری کمتری دارند اما بسیار کم هزینه‌تر و قابل دوام‌تر هستند (برای نمونه به مورد ۴ بخش تجربیات جهانی مراجعه شود). RCTهای سیاستی از نظر اثربخشی دارای ظرفیت بیشتری هستند اما ریسک بیشتری دارند و پرهزینه‌تر هستند و عمدتا با موانع بیشتری رو به رو هستند. اما به طور کلی شروع تلاش برای اجرای RCTها موثر است. نتایج نظرسنجی از نمایندگان مجلس استرالیا نشان داد از میان آن دسته از نمایندگانی که در گذشته از نتایج RCT برای تصمیم‌گیری‌ها استفاده کرده بودند، ۶۷ درصد RCTها را به عنوان یکی از سه ورودی اولویت دار در تصمیم‌گیری‌های سیاستی خود برای آینده انتخاب کرده بودند و در مقابل تنها ۱۲ درصد از نمایندگانی که قبلا از RCT استفاده نکرده بودند، این روش را در آینده اولویت خود در تصمیم گیری می‌دانستند [6]. در واقع این مسئله قدرت آشنایی با RCTها را نشان می‌دهد. صرفا شروع به استفاده از RCTها می‌تواند به تقاضای بیشتر برای بکارگیری آنها در آینده کمک کند.

۲. توصیه دوم این است که نمایندگان مجلس پیش از تصمیم‌گیری‌ها، شواهد و نتایج RCTهای مرتبط با قوانین، طرح‌ها و لوایح را از مراکز پژوهشی مطالبه نمایند و تصمیم‌گیری‌های خود و نیز تخصیص بودجه به قوانین و طرح‌ها را مبتنی بر شواهد ارائه شده انجام دهند. همچنین نمایندگان می‌توانند رویکرد «پرداخت برای موفقیت» را اتخاذ کنند [20] که طبق آن بودجه صرفا در طرح‌ها و برنامه‌هایی هزینه می شود که شواهدی از اثربخشی و دستیابی به اهداف معین، پیش از اجرای اصلی (طبق نتایج RCTها) ارائه می‌کنند .

۳. اهتمام جدی به بررسی اثربخشی قوانین و طرح‌ها پیش از تصمیم گیری قطعی حول آنها نیاز است. برای این مورد پیشنهاد می‌شود درصدی از بودجه برنامه‌ها و طرح‌ها (طبق پیشنهادات جهانی ۱ درصد از بودجه کل طرح) به ارزیابی پیشینی و کارآمدی طرح تخصیص پیدا کند. طبق یک اصطلاح مطرح، حداقل ۱ سنت از هر دلار باید برای تعیین اینکه چه چیزی موثر است سرمایه گذاری شود تا ۹۹ سنت دیگر به طور موثر و کارآمدتر هزینه شود [20].

۴- از آنجایی که طراحی و اجرای RCTهای مناسب، کاری تخصصی است و به صورت متمرکز باید انجام گیرد، پیشنهاد می‌شود کارگروهی تخصصی و با کارکرد طراحی و اجرای RCTهای مرتبط با قوانین، لوایح و طرح‌های مجلس ایجاد شود (ذیل مرکز پژوهش‌های مجلس و در یکی از دفاتر آن) و یا در غیر این صورت مرکزی با این تخصص برای این هدف به استخدام مرکز پژوهش‌های مجلس شورای اسلامی درآید. این مرکز به صورت متمرکز به تامین نیازهای روز مجلس شورای اسلامی و ارائه نتایج RCTها می‌پردازد و این نتایج را به نمایندگان ارائه می‌نمایند و موظف است دقیق‌ترین راهبردهای ممکن را برای بهبود برنامه‌ها و طرح‌ها ارائه دهد. هچنین منابع تخصصی و علمی، فنی و انسانی مورد نیاز را متمرکز می‌کند و بار برون سپاری پراکنده را کاهش می‌دهد و از ظرفیت متخصصین و جامعه دانشگاهی نیز استفاده می‌نمایند. نهایتا قانون گذاری شواهد محور و روش کارآزمایی تصادفی کنترل شده را ترویج می‌کند و بر فرآیند آن نظارت انجام می‌دهد.

۵- ترویج و گسترش اجرای روش RCT نیازمند حمایت مسئولین و افزایش انعطاف پذیری نهادهای بالادستی می‌باشد. طراحی و اجرای RCTهای مطلوب توسط متخصصین نیازمند حمایت و همراهی مسئولین در دادن دسترسی‌ها، مجوزها و اختیارات مورد نیاز به متخصصین دست‌اندرکار می‌باشد تا بتوانند استراتژی‌های مبتکرانه بکار برند و RCTهای مورد نیاز را طراحی و پیاده سازی کنند و نتایج را ارزیابی و ارائه نمایند. برای نمونه در آمریکا حمایت رئیس جمهور اوباما در صدور دستورالعمل التزام دولت بر استفاده از شواهد و در انگلستان دسترسی و مجوز دفتر نخست وزیر برای ایجاد مرکز BIT بر گسترش استفاده از روش RCT و دستیابی به ارزش افزوده‌های آن برای حکمرانی بسیار موثر بود [20].

۶- نهایتا آخرین توصیه حمایت از اشتراک گذاری و استفاده مناسب از داده‌ها و شواهد است. نتایج کارآزمایی‌های تصادفی کنترل شده باید در قالبی کاربرپسند منتشر و ترویج شود. در واقع مطلوب است تا بخش‌های مختلف مجلس و سایر نهادهای حکمرانی و مسئولین به نتایج شواهد دسترسی داشته باشند و این نتایج با بخش‌های مختلف به اشتراک گذاشته شود تا مورد استفاده قرار گیرد (البته با رعایت ملاحظات محرمانگی). عدم شفافیت ارزیابی‌ها، اعتبار همه ارزیابی‌ها و تصمیمات مبتنی بر شواهد را کاهش می‌دهد ضمن اینکه با این اشتراک گذاری سایر نهادهایی که به این نتایج نیاز داشتند دسترسی پیدا می‌کنند و پیوند داده‌ها بین نهادها رخ می‌دهد و از این پیوند و شبکه داده‌ها می‌توان در جهت بهبود نتایج بهره برد.

[1]دلاورپور اقدم، مصطفی (1401). ویژگیها و شاخصهای مجلس کارآمد در منشور بیانات رهبر معظم انقلاب. تهران: مرکز پژوهشهای مجلس شورای اسلامی، دفتر مطالعات سیاسی.

[2] World Health Organization. (2021). Evidence, policy, impact: WHO guide for evidence-informed decisionmaking.

[3] Haynes, L., Goldacre, B., & Torgerson, D. (2012). Test, learn, adapt: developing public policy with randomised controlled trials. Cabinet Office-Behavioural Insights Team.

[4] Wilson, T. D., & Juarez, L. P. (2015). Intuition is not evidence: Prescriptions for behavioral interventions from social psychology. Behavioral Science & Policy, 1(1), 13-20.

[5] Halpern, D. (2015). What works? The rise of experimental government. In Inside the nudge unit: How small changes can make a big difference. Random House.

[6] Ames, P., & Wilson, J. (2016). Unleashing the potential of randomised controlled trials in Australian governments (Doctoral dissertation, Harvard University).

[7] Alexander, D., & Letwin, O. (2013). What Works: evidence centres for social policy. London: Cabinet Office.

[8] Hansen, P. G. (2019). Tools and ethics for applied behavioural insights: the BASIC toolkit. Organisation for Economic Cooporation and Development, OECD.

[9] Pettersson, J. (2014). Randomized controlled trials: strengths, weaknesses and policy relevance.

[10] White, H., Sabarwal, S., & de Hoop, T. (2014). Randomized controlled trials (RCTs). Methodological Briefs, Impact Evaluation, (7).

[11] Stéphane, J. (2020). How can governments leverage policy evaluation to improve evidence informed policy making?.

[12] Peter John (2020): Improving Causal Claims in Public Policy through Randomized Designs in the Field, Journal of Comparative Policy Analysis: Research and Practice

[13] Duflo, E. (2016, June). Randomized controlled trials, development economics and policy making in developing countries. In World Bank Conference: The State of Economics, The State of the World, Washington DC.

[14] Kettle, S., & Persian, R. (2022). Target, explore, solution, trial, scale: An introduction to running simple behavioural insights projects. BIT Handbook.

[15] Buck, S., & McGee, J. (2015). Why government needs more randomized controlled trials: Refuting the myths. Houston, TX: Laura and John Arnold Foundation.

[1۶] مرکز بینشهای رفتاری ایران (1400). استفاده از تلنگرهای متن پایه طراحی شده توسط اصول علوم رفتاری با هدف افزایش میزان واکسیناسیون کووید-( 1۹دوز بوستر)

[17] Pew-MacArthur Results First Initiative. (2015). Legislating evidence-based policymaking: A look at state laws that support data-driven decision-making. Issue Brief, 862-872.

[18] عبدالحسین زاده، محمد. نوروزی، میکائیل (1401). راهکارهای کاهش سوگیریهای شناختی به منظور ارتقای کیفیت تصمیم گیری مجلس شورای اسلامی. تهران: مرکز پژوهشهای مجلس شورای اسلامی، دفتر مطالعات حکمرانی.

[19] عبدالحسین زاده، محمد. هارونی، فهیمه (1402) .خطمشی گذاری هوشمند، رویکردی نوین برای کارآمدسازی نظام تصمیم گیری و قانونگذاری کشور. تهران: مرکز پژوهشهای مجلس شورای اسلامی، دفتر مطالعات حکمرانی.

[20] result for emerica. (2019). 9 Ways to Make Federal Legislation Evidence-Based: 2019 What Works Guide

for Congress.

[21] مرکز بینشهای رفتاری ایران (1400). استفاده از تلنگرهای متن پایه طراحی شده توسط اصول علوم رفتاری با هدف افزایش میزان واکسیناسیون کووید-( 1۹دوز بوستر)

ماهنامه گزارش های کارشناسی مرکز پژوهش های مجلس شورای اسلامی

دوره 32، شماره 8
آبان 1403 شماره مسلسل:20233

XML

اصل گزارش 3.81 M

تعداد مشاهده گزارش	226
تعداد دریافت فایل اصل گزارش	104

ماهنامه گزارش های کارشناسی مرکز پژوهش های مجلس شورای اسلامی

مروری بر تجارب جهانی کاربست کارآزمایی تصادفی کنتر ل شده (RCTs ) در چارچوب مراکز بینش رفتاری و ارائه توصیه هایی برای مجلس شورای اسلامی

2-1. خط‌مشی‌گذاری شواهد محور در مقابل خط‌مشی‌گذاری شهودی

2-2. معرفی چیستی و ضرورت بکارگیری کارآزمایی‌های تصادفی کنترل‌شده (RCTs)

2-3. مزایای استفاده از کارآزمایی‌های تصادفی کنترل‌شده (RCTs) توسط نهادهای حکمرانی

3-1. تجربه وزارت کار و بازنشستگی (DWP) انگلستان در ورود افراد ناتوان به بازار کار

3-2. تجربه مشارکت پرستار خانواده؛ پیشگیری از آسیب پذیری مادران در آمریکا

3-3. بررسی اثربخشی اعطای وام‌های خرد کارآفرینی در حیدرآباد هند

3-5. مطالعه موردی یک مرکز What Works در حوزه آموزش؛ کاربست کارازمایی‌های تصادفی کنترل شده متعدد در بهبود پیشرفت تحصیلی دانش آموزان در انگلستان

8-1. کارآزمایی‌های تصادفی کنترل شده (RCTs) در اسناد و قوانین بالادستی

8-2. پیشنهادات مرتبط با کاربست عملی کارآزمایی‌های تصادفی کنترل شده (RCTs)

دوره 32، شماره 8
آبان 1403 شماره مسلسل:20233

صفحه اصلی

جستجوی پیشرفته

تماس با ما

ماهنامه گزارش های کارشناسی مرکز پژوهش های مجلس شورای اسلامی

مروری بر تجارب جهانی کاربست کارآزمایی تصادفی کنتر ل شده (RCTs ) در چارچوب مراکز بینش رفتاری و ارائه توصیه هایی برای مجلس شورای اسلامی

2-1. خط‌مشی‌گذاری شواهد محور در مقابل خط‌مشی‌گذاری شهودی

2-2. معرفی چیستی و ضرورت بکارگیری کارآزمایی‌های تصادفی کنترل‌شده (RCTs)

2-3. مزایای استفاده از کارآزمایی‌های تصادفی کنترل‌شده (RCTs) توسط نهادهای حکمرانی

3-1. تجربه وزارت کار و بازنشستگی (DWP) انگلستان در ورود افراد ناتوان به بازار کار

3-2. تجربه مشارکت پرستار خانواده؛ پیشگیری از آسیب پذیری مادران در آمریکا

3-3. بررسی اثربخشی اعطای وام‌های خرد کارآفرینی در حیدرآباد هند

3-5. مطالعه موردی یک مرکز What Works در حوزه آموزش؛ کاربست کارازمایی‌های تصادفی کنترل شده متعدد در بهبود پیشرفت تحصیلی دانش آموزان در انگلستان

8-1. کارآزمایی‌های تصادفی کنترل شده (RCTs) در اسناد و قوانین بالادستی

8-2. پیشنهادات مرتبط با کاربست عملی کارآزمایی‌های تصادفی کنترل شده (RCTs)

دوره 32، شماره 8آبان 1403 شماره مسلسل:20233

فایل ها

هم رسانی

ارجاع به این گزارش

آمار

صفحه اصلی

مرور

اطلاعات نشریه

جستجوی پیشرفته

تماس با ما

دوره 32، شماره 8
آبان 1403 شماره مسلسل:20233