نوع گزارش : گزارش های راهبردی
نویسنده
مدیر گروه آینده پژوهی دفتر مطالعات بنیادین حکمرانی مرکز پژوهشهای مجلس شورای اسلامی
چکیده
در سطح کلان و خرد حکمرانی به طور مستمر خط مشی ها، قوانین، برنامه ها و مداخلات با هدف بهبود وضعیت کشور و مردم و دستیابی به اهداف بالادستی طراحی، تصویب و اجرا می شود. با این حال عمدتا در مورد اینکه این خط مشی ها و قوانین تا چه اندازه به معنای واقعی اثربخش و کارآمد هستند، اطلاعات کمی وجود دارد. سیاستگذاران خط مشی ها، قوانین و برنامه ها جدیدی را طراحی و جایگزین موارد موجود می کنند بدون آنکه این اطمینان وجود داشته باشد آیا آنها موثر هستند یا خیر و یا چگونه می توان آنها را بهبود داد. از این جهت امروزه در سطح جهان رویکرد خط مشی گذاری شواهد محور و قانونگذاری شواهد محور گسترش یافته است. طبق این رویکرد نوین، سیاستگذاران پیش از تصویب و اجرای خط مشی ها، قوانین و برنامه های جدید، شواهد کافی را پیرامون اثربخشی آنها در اختیار دارند و مبتنی بر شواهد دقیق، موثرترین خط مشی ها را اتخاذ می کنند و کیفیت آن ها را بهبود می بخشند. یکی از بهترین و دقیق ترین روش برای اطلاع از اینکه آیا یک خط مشی، قانون یا برنامه اثربخش و کارآمد است یا خیر، کارآزمایی های تصادفی کنترل شده (RCTs) هستند. در این گزارش ظرفیت کارآزمایی های تصادفی کنترل شده در قانونگذاری شواهد محور مورد توجه قرار گرفته و ضمن آشنایی با این روش، الزامات و نحوه بکارگیری آن، پیشنهادات و توصیه هایی نیز پیرامون کاربست این روش در مجلس شورای اسلامی به عنوان یکی از مهمترین نهادهای حکمرانی کشور ارائه گردیده است.
گزیده سیاستی
امروزه در جهان، سیاستگذاران پیش از تصویب و اجرای خط مشی ها، شواهد کافی را پیرامون اثربخشی آنها تحلیل میکنند که از جمله ابزارهای آن کارآزمایی های تصادفی کنترل شده (RCTs)است. در این گزارش این ابزار در چارچوب مراکز بینش رفتاری مورد بررسی قرار گرفته و توصیه هایی برای مجلس شورای اسلامی ارائه شده است.
کلیدواژهها
موضوعات
بیان/شرح مسئله
سیاستگذاران اغلب تصور میکنند درک خوبی از خطمشیها، برنامهها و مداخلات موثر دارند و میتوانند اثربخشی آنها را پیشبینی کنند لذا مبتنی بر این تفکر، اغلب سیاستمداران، خطمشیها و مداخلات را انتخاب و پیاده سازی میکنند. طبق تجربیات جهانی، نمونههای زیادی از خطمشیها و مداخلات وجود دارند که نشان میدهند علیرغم اعتقاد بر اثربخش بودن، نه تنها موثر نبودند بلکه آسیبزا نیز بودند . خطمشیگذاری و قانونگذاری شواهد محور بهترین روش برای اجتناب از اشتباهات در اتخاذ خطمشیهای کارآمد و موثر است که سبب میشود از اتلاف منابع و آسیبهای احتمالی جلوگیری شود. خطمشیگذاری شواهد محور (EBP) تاکید میکند که خطمشیها باید مبتنی بر بهترین شواهد موجود از تحقیقات و آزمایشات اتخاذ شوند تا پیش از تخصیص منابع این اطمینان وجود داشته باشد که اولا آن خطمشی در زمینه مدنظر امکان اجرایی شدن دارد، ثانیا مورد پذیرش واقع میشود و نهایتا موثر و کارآمد است .
در قلب هر RCT تعدادی عناصر کلیدی وجود دارد که نحوه عملکرد RCTها را نیز نشان میدهند: اولا انتخاب نمونه تصادفی و معرف جامعه و تقسیم جمعیت به دو یا چند گروه بر اساس تخصیص تصادفی؛ ثانیا ارائه یک مداخله به یک گروه و مداخله دیگر به گروهی دیگر و داشتن گروه کنترل؛ و نهایتا اندازهگیری پیامدهای از پیش تعیین شده (متغیر وابسته) برای هر گروه .
عموما در خطمشیگذاریها دو نوع RCT را میتوان اجرا کرد: اول RCTهای بهینهساز که به دنبال بهبود اثربخشی خطمشیهای موجود هستند و دوم RCTهای سیاستی که به دنبال آزمایش اثربخشی انواع مختلف خطمشیها، برنامهها یا مداخلات جدید و موجود هستند. اما صرف نظر از انواع RCTها باید گفت اصول هر دو یکی است: با مقایسه دو گروه یکسان که به طور تصادفی انتخاب شده اند، میتوان طیف وسیعی از عوامل را کنترل کرد و قدرت تشخیص اینکه چه چیزی کارآمد است و چه چیزی کارآمد نیست را پیدا کرد .
استفاده از RCTها توسط نهادهای حکمرانی مزایای گوناگونی دارد:
۱- هزینه کردن بودجه در خطمشیها و برنامههای مقرون به صرفه
۲- ایجاد قدرت دفاع از تصمیمات خطمشی و افزایش اعتبار حاکمیت
۳- اصلاح مستمر خطمشیها در جهت بهبود کارآیی آنها
۴- ارائه چشم اندازی مطلوب برای پرداختن به موضوعات و رویکردهای سیاسی مناقشهبرانگیز و دارای اختلاف نظر به کمک ارائه شواهد واقعی
نقطه نظرات/یافتههای کلیدی
هر چند که استفاده از روش RCT بیش از ۷۰ سال است که در علوم پزشکی مورد استفاده قرار میگیرد اما بکارگیری RCTها در خطمشیگذاریهای اجتماعی جهان در دو دهه اخیر رشد فراوانی پیدا کرده است و در حوزههای مختلف خطمشیگذاری اعم از جرم و عدالت، آموزش، رفاه اجتماعی، بهداشت، آموزش همچنین در توسعه بین المللی و تجارت و غیره پیاده سازی میشود .
با همراهی متخصصین، حمایت مسئولین و خطمشیگذاری مناسب، راه اندازی RCTها بسیار کم هزینهتر و سادهتر از آنچه اغلب تصور میشود، هستند. در ادامه دستورالعمل اجرای یک RCT آورده شده است. این دستورالعمل طبق چارچوب «آزمایش، یادگیری و تطبیق» تیم بینشهای رفتاری انگلستان (BIT) که در سال ۲۰۱۲ ارائه شد، به شرح زیر است :
مرحله ۱: دو یا چند مداخله خطمشی را برای مقایسه شناسایی و انتخاب کنید.
مرحله ۲: نتیجهای را که مداخله خطمشی قصد دارد بر آن تاثیر بگذارد و نحوه سنجش آن در آزمایش را تعریف کنید.
مرحله ۳: پیرامون واحد تصادفی سازی تصمیمگیری کنید.
مرحله ۴: تعیین کنید چه حجم نمونهای برای دریافت نتایج قوی مورد نیاز است.
مرحله ۵: هر واحد را با استفاده از روش تصادفیسازی به یکی از مداخلات خطمشی اختصاص دهید.
مرحله ۶: مداخلات خطمشی را به گروههای اختصاص داده شده ارائه کنید.
مرحله ۷: نتایج را اندازهگیری کنید و تاثیر مداخله خطمشی را تعیین نمایید.
مرحله ۸: مداخله خطمشی را طبق نتایج به دست آمده، تطبیق دهید.
مرحله ۹: به مرحله اول بازگردید تا به طور مداوم درک خود از آنچه موثر است را بهبود ببخشید.
هر چند فرصتهای اجرای RCT فراوان هستند اما تبدیل شدن اجرای RCTها در کشور به عنوان یکی از بخشهای ضروری فرایند خطمشیگذاری نیازمند ایجاد ظرفیت و فراهم شدن شرایط لازم است. سه ظرفیت اساسی در این گزارش مطرح شده است که اگر این سه ظرفیت فعال شوند، میتوان امید داشت که در حکمرانی کشور از شواهد به نحو موثر استفاده خواهد شد. این سه ظرفیت شامل فرهنگ و رهبری، تجربه و تخصص و نهایتا شفافیت است .
علاوه بر تجربیات جهانی از خطمشیگذاری حول ترویج رویکرد شواهد محور و کاربست کارآزماییهای تصادفی کنترل شده در اسناد بالادستی کشور نیز میتوان مویداتی بر اهمیت استفاده از این رویکرد پیدا کرد. طبق بند نهم «سیاستهای کلی نظام قانونگذاری» در قانونگذاریها باید از قابل اجرا بودن قانون، قابل سنجش بودن قانون و ابتناء بر نظرات کارشناسی و ارزیابی تأثیر اجرای قانون اطمینان حاصل کرد و سازوکارهای لازم را جهت اعمال این موارد فراهم ساخت.
پیشنهاد راهکارهای سیاستی، نظارتی یا تقنینی
نهایتا پیشنهادها و توصیههای این گزارش جهت ترویج و بکارگیری روش کارآزمایی تصادفی کنترل شده در فرایندهای مجلس شورای اسلامی به شرح زیر هستند:
۱- بهترین راه برای ترویج و بکارگیری RCTها، شروع تلاش است. یادگیری از تجربه و کار بر روی RCTها منجر به توسعه بلندمدت قابلیت RCT میشود.
۲- نمایندگان پیش از تصمیمگیریها، شواهد و نتایج RCTهای مرتبط با قوانین، طرحها و لوایح را از مراکز پژوهشی مطالبه نمایند و تصمیمگیریهای خود و نیز تخصیص بودجه به قوانین و طرحها را مبتنی بر شواهد ارائه شده انجام دهند.
۳- اهتمام جدی به بررسی اثربخشی قوانین و طرحها پیش از تصمیم گیری قطعی با تخصیص درصدی از بودجه برنامهها به ارزیابی پیشینی و کارآمدی طرح وجود داشته باشد.
4- مسئولین و نهادهای بالادستی حمایت، همراهی و انعطاف پذیری لازم را در جهت طراحی و اجرای RCTها انجام دهند و برای متخصصین دستاندرکار دسترسیها، مجوزها و اختیارات مورد نیاز را فراهم کنند.
5- در نهایت از اشتراک گذاری و استفاده مناسب از دادهها و شواهد حمایت شود تا ضمن افزایش اعتبار ارزیابیها و تصمیمات، سایر نهادها بتوانند از این شبکه دادهها بهره ببرند.
طبق قانون اساسی جمهوری اسلامی ایران، مجلس شورای اسلامی دارای صلاحیت عام قانونگذاری در کشور است. مجلس شورای اسلامی با صلاحیت قانونگذاری خود، مظهر اراده ملی و دارای جایگاهی ممتاز در ساختار حقوق اساسی جمهوری اسلامی ایران است. کارکرد تقنینی مجلس شورای اسلامی آنچنان حائز اهمیت است که رهبر معظم انقلاب در دیدار با نمایندگان مجلس فرمودند که «کیفیت قانونگذاری هر سال در قیاس با سال قبل باید بهبود یابد». این امر نشانگر اهمیت ویژه توجه به «کیفیت قانونگذاری» است. از نگاه رهبر انقلاب، صرف تصویب قوانین نباید به عنوان هدف غایی تلقی شود بلکه بایستی آثار و نتایج مصوبات مجلس بر جامعه نیز مشخص شود. برای مثال ایشان در دیدار نمایندگان و کارکنان مجلس شورای اسلامی فرمودند که «مهم این است که چیزی که تصویب شده است، چه قدر در رفع مشکلات و پیشرفت کشور و رعایت حال عموم مردم «تاثیر» داشته است، پس صرفا کمیت کفایت نمیکند و بایستی کیفیت را نیز ملاحظه کرد» [۱].
ارزیابی نتایج قوانین و خطمشیها اساسا به حکمرانی سالم کمک میکند و میتواند بر طراحی و اجرای خطمشیهای کارآمد، موثر باشد که به نوبه خود به ارتقای رفاه کشور و مردم منجر میشود. کارآزمایی (آزمایش)های تصادفی کنترلشده (RCTs) یکی از بهترین روشهای ارزیابی خطمشیها هستند و در قلب جنبش خطمشیگذاری شواهد محور قرار دارند. خطمشیگذاری شواهد محور تاکید میکند که خطمشیها باید مبتنی بر بهترین و قویترین شواهد موجود از تحقیقات، مقرون به صرفه بودن، اثربخشی، مقبولیت برای ذینفعان، پذیرش افکار عمومی و غیره طراحی و اجرا شوند [2]. این فرایند کمک میکند تا اطمینان حاصل شود که قوانین و مقررات پیشنهادی از نظر اثربخشی و نیز مقرون به صرفهبودن، کارآمد هستند. همانطور که مطرح شد، شواهد قابل استفاده انواع متنوعی دارند و RCTها یکی از قویترین و مهمترین انواع شواهد هستند که در این گزارش از این انواع شواهد صرفا به RCTها پرداخته میشود.
RCTها استاندارد طلایی هستند چراکه میتوانند ارزیابی علّی انجام دهند و در تعیین اینکه آیا یک خطمشی یا برنامه اثربخش و کارآمد است یا خیر نقش داشته باشند [3]. مبدا کارآزماییهای تصادفی کنترلشده به علوم پزشکی برمیگردد و این روش بیش از ۷۰ سال است که مورد استفاده قرار گرفته است. اما حدودا ۲ دهه است که RCTها به صورت جدی در خطمشیگذاری و قانونگذاری بکاربرده میشوند. امروزه RCTها به طور فزایندهای در حوزههای مختلف قانونگذاری و خطمشیگذاری عمومی، توسعه بین المللی، تجارت و غیره مورد استفاده هستند [۴].
بسیاری از خطمشیها و برنامهها قبل از اینکه مورد ارزیابی قرار گیرند و شواهد کافی در مورد اثربخشی آنها وجود داشته باشد، به طور گسترده و در سطح کشور اجرا میشوند زیرا طبق استدلالهای منطقی و نظرات شهودی به نظر میرسد که کارآمد و موثر هستند. اما برخی از همین خطمشیها پس از گذشت مدت زمانی از اجرایی شدن و صرف منابع و ایجاد هزینههای زیاد نتیجه مطلوب را حاصل نمیکنند و بی اثر بودن و یا حتی داشتن آسیب را نشان میدهند [۴]. استفاده از RCTها میتواند برای جلوگیری از این مسائل و اتخاذ خطمشیهای کارآمد مفید باشد. در واقع اجرای کارآزماییهای تصادفی کنترل شده پیش از تصمیمگیری پیرامون تصویب قوانین و خطمشیها سبب میشود تا قوانین موثر شناسایی شوند و بودجه به سمت موثرترین قوانین و خطمشیها که بازدهی بالاتری دارند، هدایت شود و همچنین مبتنی بر شواهد به دست آمده، قوانینی که اثربخش نیستند و نتایج مورد انتظار را ارائه نمیدهند، شناسایی و حذف شوند.
با توجه به اهمیت کارآزماییهای تصادفی کنترلشده و مزایایی که استفاده از آنها در خطمشیگذاری عمومی دارد و همینطور بکارگیری این رویکرد در جهان و موفقیت آن، ضروری است رویکرد خطمشیگذاری شواهد محور نیز در حکمرانی ایران علی الخصوص در خطمشیگذاریها و قانونگذاریهای مجلس شورای اسلامی اتخاذ شود و از مزایای آن برای بهبود کارآمدی خطمشیها و قوانین بهره برده شود.
گزارش حاضر با هدف نشان دادن کاربرد کارآزماییهای تصادفی کنترل شده در خطمشیگذاری شواهد محور و جایگاه آن در فرایندهای قانونگذاری مجلس شورای اسلامی تهیه شده است. در بخش اول این گزارش و در تبیین مبانی و دلالتهای نظری به مقایسه خطمشیگذاری شواهد محور و خطمشیگذاری شهودی پرداخته میشود؛ سپس چیستی و ضرورت بکارگیری روش RCT توضیح داده میشود و مزایای استفاده از شرح داده میشود. در بخش دوم گزارش، تجربیات جهانی از بکارگیری این رویکرد در خطمشیگذاری مطرح میگردد تا گسترده استفاده جهانی از این رویکرد نشان داده شود. بخش سوم گزارش، ویژگیهای منحصر به فرد و متمایز کننده روش RCT را مطرح میکند. بخش چهارم گزارش به الزامات و شرایط استفاده از این روش میپردازد. در بخش پنجم گزارش و در طی یک راهنمای عملی، دستورالعمل و نحوه استفاده از کارآزماییهای تصادفی کنترل شده ارائه میشود. بخش ششم گزارش، ضرورت و پایههای ظرفیتسازی در جهت کاربست این روش را مطرح میکند. نهایتا در بخش هفتم و آخر گزارش توصیهها و پیشنهاداتی عملی و اجرایی برای مجلس شورای اسلامی در راستای بکارگیری این روش کارآزمایی تصادفی کنترل شده ارائه میشود. امید است ضمن معرفی این رویکرد، زمینههای بکارگیری آن در کشور فراهم شود.
سیاستگذاران اغلب تصور میکنند درک خوب و کاملی از خطمشیها، برنامهها و مداخلات موثر دارند و میتوانند اثربخشی آنها را پیشبینی کنند فلذا مبتنی بر این تفکر، اغلب سیاستمداران، خطمشیها و مداخلات را انتخاب و پیاده سازی میکنند [3]. ادبیات پژوهشی و نیز تجربیات جهانی نشان داده است که پیش بینیهای مطمئن در مورد خطمشیهای موثر توسط سیاستمداران و کارشناسان اغلب کاملاً درست نیستند [3]. طبق مفهوم نظری «پیامدهای ناخواسته» که توسط رابرت مرتون جامعه شناس آمریکایی مطرح شد، اقدامات هدفمند میتوانند پیشآمدها و نتایجی که به صورت اولیه قابل پیشبینی نبودند، ایجاد کنند. این پیامدهای ناخواسته میتوانند در سه دسته فایده غیرمنتظره، زیان غیرمنتظره و نتیجه انحرافی خلاصه شوند. تجربیات جهانی نیز نشان داده اند مداخلاتی که با اطمینان پیشبینی میشدند که اثربخش هستند، تاثیرگذار نبودهاند و بالعکس بعضاً مداخلاتی که به آنها بدبینی وجود داشت، نهایتاً موفق و اثربخش بودند.
نمونههای زیادی نیز از خطمشیها و مداخلات وجود دارند که نشان میدهند علیرغم اعتقاد به اثربخش بودن، نه تنها موثر نبودند بلکه مضر و آسیبزا بودهاند [3]. برای مثال برنامه scared straight برنامهای دولتی با هدف کاهش سطح جرم و جنایت در میان نوجوانان آسیب پذیر در آمریکا بود. ایده اصلی این خطمشی به لحاظ شهودی جذاب و مفید بود. این ایده بدین شرح بود: اگر نوجوانان با واقعیتهای زندگی مجرمین آشنا شوند و عواقب احتمالی رفتارهای اکنون خود را ببینند، احتمال کمتری دارد به سمت رفتارهای مجرمانه سوق پیدا کنند و احتمالا تشویق میشوند تا بیشتر درس بخوانند و کمتر به سمت مواد مخدر و سایر رفتارهای مخرب روی بیاورند. این ایده به لحاظ شهودی جذاب است و موثر به نظر میرسد زیرا هشدار به نوجوانان سبب میشود بیشتر به زندگی سالم پایبند باشند و به این نحو از جرم پیشگیری میشود. این خطمشی دههها در آمریکا توسط افرادی که نیتهای مثبتی در جهت پیشگیری از جرم داشتند پیادهسازی شد. اما بعد از مدتها، شواهدی از آزمایشهای انجام شده به دست آمد که نشان میداد این مداخلات نه تنها برای پیشگیری از جرم موثر نبودند بلکه سبب افزایش جرم در نوجوانان میشدند [5]. نمونه چنین ارزیابیهایی فراوان هستند که تاثیر معکوس، بی تاثیر بودن و یا حتی میزان تاثیرگذاری خطمشیها را بررسی کردهاند و بینشهای موثری به سیاستمداران برای اتخاذ رویکردهای کارآمدتر مبتنی بر شواهد قوی تجربی ارائه داده اند (برای نمونه به مورد ۱ و ۳ بخش تجربیات جهانی مراجعه شود). در واقع خطمشیگذاری شواهد محور بهترین روشی است که برای اجتناب از اشتباهات در اتخاذ خطمشیهای کارآمد و موثر وجود دارد و سبب میشود از اتلاف منابع و آسیبهای احتمالی جلوگیری شود زیرا در بهترین حالت میلیاردها تومان صرف برنامههایی شده است که هیچ تاثیری نداشتهاند و در بدترین حالت صدمات و آسیبهای واقعی از روی ناآگاهی به انسآنها و جامعه زده میشود [۴].
وقتی منابع مالی محدود است، اطمینان از اینکه منابع به صورت کارآمد سرمایه گذاری شود، اهمیت بیشتری مییابد. یک اصل اساسی خطمشیگذاری خوب این است که تصمیمات بر اساس شواهد قوی و آنچه اطمینان وجود دارد، موثر است، گرفته شود [7]. تصمیم گیری مبتنی بر شواهد (EIDM) یا خطمشیگذاری مبتنی بر شواهد (خطمشیگذاری شواهد محور) (EBP) تاکید میکند که خطمشیها باید مبتنی بر بهترین شواهد موجود از تحقیقات و آزمایشات اتخاذ شوند تا پیش از تخصیص منابع این اطمینان وجود داشته باشد که اولا آن خطمشی در زمینه مدنظر امکان اجرایی شدن دارد، ثانیا مورد پذیرش واقع میشود و نهایتا موثر و کارآمد است [2]. رویکرد خطمشیگذاری شهودی، عموما مبتنی بر حدس و گمان است و تصمیمگیری در مورد انتخاب خطمشیها و برنامهها براساس شهود انجام میشود. با توجه به سوگیری شناختی «خودتاییدی» وقتی خطمشی یا برنامهای اجرا شد تمایل وجود دارد که فقط موارد موفقیت آمیز آن دیده شود و مواردی که اثرگذار نبودهاند و یا حتی تاثیر معکوس داشتهاند استثنا و غیر پایدار تلقی شوند زیرا طبق این سوگیری افراد تمایل دارند مواردی را بپذیرند که منطبق با باورهای قبلی آنها بوده است و مواردی که منطبق نیستند را رد کنند [5]. رویکرد «خطمشیگذاری مبتنی بر شواهد» درست در مقابل رویکرد «شواهد مبتنی بر خطمشی یا شواهد خطمشی محور» است که در آن شواهد به صورت انتخابی و برای حمایت از یک برنامه خطمشی از پیش تعیین شده استفاده میشوند [6].
جهت استفاده کارآمد از شواهد در خطمشیگذاریها نیاز به «اکوسیستم شواهد» وجود دارد. یک اکوسیستم شواهد، سیستمی منعکسکننده پیوندها و تعاملات رسمی و غیررسمی بین بازیگران متعدد درگیر در امر شواهد است. این اکوسیستم شواهد را تولید میکند، سپس شواهد تولید شده را طبق نیاز خطمشیگذاری ترجمه میکند و نهایتاً کمک میکند تا شواهد به بهترین نحو در خطمشیگذاری مورد استفاده قرار گیرند [2]. از سال ۲۰۱۱ تا ۲۰۱۵ در انگلستان مجموعهای از موسسات و مراکز دولتی و خصوصی برای ایجاد اکوسیستم شواهد و تقویت استفاده از شواهد توسط سیاستگذاران و شاغلین تاسیس شد. این مراکز یک هدف مشترک ساده داشتند: گردآوری و ایجاد شواهد بر اساس آنچه کارآمد است و قراردادن این شواهد در دسترس مسئولین و افراد ذی ربط. این مراکز در جهان، مراکز «what works» نامیده میشوند [5].
عملکرد این مراکز میتواند در چند مورد مفید باشد: اولین مورد، زمانی است که مسئولین و سیاستگذاران میخواهند بدانند بهترین نحوه هزینه کردن بودجه برای حل یک مسئله چیست. دومین مورد برای شرایطی است که سیاستگذاران به دنبال بهترین روش برای ارائه یک برنامه و چگونگی بهبود آنها هستند و نهایتاً میتواند برای اینکه سیاستگذاران متوجه شوند که آن خطمشی و برنامه تا چه اندازه مقرون به صرفه و کارآمد است، مفید واقع شود [7]. استفاده از روش آزمایشی توسط جنبش what works گسترش یافته و این مراکز در موضوعات مختلف و ذیل نهادهای دولتی مختلف به صورت اختصاصی تاسیس شدهاند. برای مثال این مراکز به صورت اختصاصی در موضوعات آموزش، جرم و جنایت، فقر و رفاه، سلامت و غیره تاسیس شده و مشغول به فعالیت هستند. مجموعاً این جنبش به دنبال کاستن از خطمشیگذاریهای شهودی و مبتنی بر فرضیات و حدس وگمان و ارتقای خطمشیگذاریهای مبتنی بر شواهد است تا امر خطمشیگذاری به صورت موثرتر و کم هزینهتر پیش رود.
کارآزماییهای تصادفی کنترلشده (RCT) در قلب جنبش شواهد محور در دو دهه اخیر خطمشیگذاری عمومی جهان هستند. RCTها به «استاندارد طلایی» مشهور هستند چرا که با توجه به ارزیابیهای علّی که انجام میدهند، بهترین روش علمی موجود برای بررسی موثر بودن یک مداخله هستند. در بخش بعد بررسی میکنیم که RCTها چه چیزی هستند و چرا اهمیت دارند [8].
سیاستگذاران اغلب نیاز دارند بدانند کدام یک از دو یا چند خطمشی، برنامه یا مداخله در دستیابی به نتایج و اهداف خاص موثرتر هستند. به عنوان مثال قرار است برنامهای جدید در مقابل برنامههای فعلی برای تشویق فرزندآوری در کشور طراحی شود. برای این کار لازم است اثربخشی و کارآمدی این دو برنامه با یکدیگر مقایسه شوند و سپس آنچه موثرتر است در مقیاس بزرگ اجرا شود. کارآزماییهای تصادفی کنترلشده (RCT) مشخصا برای ارزیابی تاثیرات علّی طراحی شده اند. استفاده از این روش به طور کلی جدید نیست و از علوم پزشکی وام گرفته شده است اما آنچه جدید است، استفاده از این روش در خطمشیگذاری میباشد [9]. در یک RCT برنامه یا خطمشی به عنوان یک مداخله در نظر گرفته میشود که در آن میزان اثربخش بودن مداخله توسط شاخصهای از پیش تعیین شده (متغیر وابسته) اندازهگیری میشود و مورد آزمایش قرار میگیرد. نقطه قوت RCT این است که پاسخ بسیار قدرتمندی به سوالات علّیت ارائه میدهد و به ارزیابان و مجریان خطمشیها و سیاستگذاران کمک میکند تا مطمئن شوند نتیجه حاصل شده ناشی از مداخله است و نه موارد دیگر [10].
به طور معمول هنگام ارزیابی اثربخشی یک مداخله، به سادگی آن مداخله اجرا میشود و سپس با مشاهده نتایج، میزان اثربخشی نتایج آن قضاوت میشود [3]. برای مثال برنامه جدید تشویق فرزندآوری مدتی در کشور اجرا میشود و بعد بر روی میزان فرزندآورری در آن بازه نظارت میشود و اگر فرزندآوری نرخ خوبی داشته باشد قضاوت میشود که برنامه موثر بوده است.
با این حال این رویکرد که عموما استفاده میشود، دارای مشکلات گستردهای است. یکی از اشکالات این است که با این رویکرد نمیتوان تشخیص داد آیا مداخله سبب ایجاد نتایج شده است یا عامل خارجی کنترلنشده دیگری مسبب ایجاد اثرات بوده است [3]. برای مثال ممکن است طرح تشویق فرزندآوری در کشور اجرا شود اما همزمان شرایط اقتصادی در کشور بهبود پیدا کند و بهبود شرایط اقتصادی سبب افزایش فرزندآوری شده باشد و به اشتباه رشد فرزندآوری به مداخله نسبت داده شود. کارآزماییهای تصادفی کنترلشده با ایجاد گروه کنترل که به آنها مداخله جدید ارائه نمیشود، این مشکل را حل میکنند.
مشکل دوم و پیچیدهتر این رویکرد ناشی از «سوگیری انتخاب» است. عموماً افرادی که میخواهند در طرحهای تشویق فرزندآوری شرکت کنند، به طور سیستماتیک و پایهای متفاوت با افرادی هستند که نمیخواهند شرکت کنند. این افراد عمدتاً انگیزه بیشتری برای فرزندآوری دارند و به این معنی هرگونه نتایج مثبت مداخله میتواند بزرگنمایی شده باشد. کارآزماییهای تصادفی کنترلشده با حصول اطمینان از اینکه افراد و گروههایی که مداخله را دریافت میکنند یا نمیکنند تا حد امکان مشابه یکدیگر هستند (با تخصیص تصادفی افراد به گروهها) این مشکل را برطرف میکنند [3]. در مثال طرح تشویقی فرزندآوری، این مورد بدین صورت است که برای مثال ابتدا ۲۰۰۰ خانواده که همگی واجد شرایط هستند انتخاب میشوند و سپس به طور تصادفی به دو گروه ۱۰۰۰ تایی تقسیم میشوند که یکی از گروهها مداخله جدید (طرح جدید تشویق فرزندآوری) را دریافت میکند و دیگری طرح فعلی فرزندآوری را دریافت میکند که در واقع گروه کنترل میباشد. با وجود گروه کنترل و نیز تخصیص تصادفی، احتمال تاثیر عوامل خارجی از بین برده میشود و نشان داده میشود هرگونه تفاوت بین دو گروه صرفا نتیجه تفاوت در مداخله دریافتی جدید است.
با توجه به توضیحات بالا میتوان گفت در قلب هر RCT تعدادی عناصر کلیدی وجود دارد. این عناصر کلیدی که نحوه عملکرد RCTها را نشان میدهند، بدین صورت هستند: اولا انتخاب نمونه تصادفی و معرف جامعه و تقسیم جمعیت به دو یا چند گروه بر اساس تخصیص تصادفی؛ ثانیاً ارائه یک مداخله به یک گروه و مداخله دیگر به گروهی دیگر و داشتن گروه کنترل؛ و نهایتاً اندازهگیری پیامدهای از پیش تعیین شده برای هر گروه [3]. این فرایند در شکل زیر خلاصه شده است:
شکل ۱. کاربست کارآزمایی تصادفی کنترل شده (RCTs) در دو گروه کنترل و مداخله
در توضیح تصویر بالا طبق مثال ساختگی این بخش میتوان گفت فرض شود یک طرح جدید تشویق فرزندآوری در حال آزمایش است که هدف آن افزایش تعداد زنان باردار میباشد. جامعه مورد ارزیابی، زنان در سن باروری هستند و از این جامعه، نمونه کوچک اما قابل تعمیمی گرفته و به صورت تصادفی به دو گروه برابر تقسیم میشود. به زنان یکی از گروهها، طرح تشویقی جدید معرفی میشود (گروه مداخله) و به گروه دیگر طرح فعلی ارائه میشود (گروه کنترل). در مثال شکل بالا زنانی که پس از گذشت ۶ ماه از ارائه طرحها باردار شدند با رنگ سبز نشان داده شده اند. این کارآزمایی فرضی نشان میدهد تعداد بیشتری از زنان که در طرح جدید تشویق فرزند آوری شرکت کرده بودند به نسبت گروه کنترل اقدام به فرزندآوری کرده بودند و این یعنی طرح جدید به نسبت طرح فعلی جهت تشویق فرزندآوری موفقتر است. توجه به این نکته مهم است که دو نفر از زنان گروه کنترل نیز اقدام به فرزندآوری کرده اند که میتواند به دلیل سطحی از اثربخشی طرح فعلی و یا سایر عوامل باشد.
اگر طرح جدید تشویق فرزندآوری موثر نباشد، الگوی مشابهی در گروه مداخله و گروه کنترل مشاهده میشود. این حالت در شکل بعدی نشان داده شده است:
شکل ۲. کاربست کارآزمایی تصادفی کنترل شده (RCTs) در دو گروه کنترل و مداخله (عدم موفقیت مداخله)
در اینجا نتایج RCT نشان میدهد که برنامه جدید و پرهزینه تشویق فرزندآوری، بهتر و موثرتر از طرحهای فعلی کشور در حمایت از فرزندآوری نیست. از این نتیجه فهم میشود که اگر هیچ گروه کنترلی وجود نداشت ممکن بود از ۲ نفری که اقدام به فرزندآوری کرده بودند به اشتباه این نتیجهگیری شود که طرح جدید، موثر است و همین مورد سبب میشد طرحی پرهزینه و ناکارآمد برای مدت طولانی در کشور اجرایی شود و سبب اتلاف منابع گردد.
میتوان گفت در هر موردی که ظرفیت عوامل خارجی برای تاثیرگذاری بر نتایج یک خطمشی وجود داشته باشد، همیشه ارزش دارد که از RCT برای آزمایش اثربخشی مداخله قبل از اجرای آن خطمشی بر روی کل جمعیت کشور استفاده شود. وقتی این کار انجام نمیشود به راحتی تاثیر سایر عوامل را میتوان به یک خطمشی یا برنامه ناکارآمد نسبت داد [3].
در مثال ساختگی طرح تشویق فرزندآوری مطرح شده در این بخش به دنبال بررسی اثربخشی دو نوع مداخله و برنامه متفاوت بودیم. اما نکته حائز اهمیت این است که در بسیاری از موارد یک RCT میتواند برای مقایسه چندین روش مختلف اجرای جنبههای مختلف و کوچکتر یک خطمشی یا برنامه خاص نیز استفاده شود. در واقع آزمایش بخشهای کوچکتر یک برنامه خاص نیز سیاستگذاران را قادر میسازد تا به طور مستمر خطمشی مدنظر را اصلاح کنند و بر جنبههای خاصی از خطمشی که بیشترین تاثیر را دارد، توجه کنند [3].
از این رو میتوان گفت عموما در خطمشیگذاریها دو نوع RCT را میتوان اجرا کرد:
۱) RCTهای بهینهساز که به دنبال بهبود اثربخشی خطمشیهای موجود هستند.
۲) RCTهای سیاستی که به دنبال آزمایش اثربخشی انواع مختلف خطمشیها، برنامهها یا مداخلات جدید و موجود هستند.
اما صرف نظر از انواع RCTها اصول هر دو یکی است: با مقایسه دو گروه یکسان که به طور تصادفی انتخاب شدهاند، میتوان طیف وسیعی از عوامل را کنترل کرد و قدرت تشخیص اینکه چه چیزی کارآمد است و چه چیزی کارآمد نیست را پیدا کرد [6].
ارزیابی خطمشیها به حکمرانی عمومی سالم کمک میکند. این امر میتواند به نهادهای حاکمیتی در بهبود طراحی و اجرای خطمشیهای عمومی کمک کند که به نوبه خود میتواند به رفاه کشور و رفاه شهروندان منجر شود. همچنین ارزیابی خطمشیها و برنامهها به ارتقای پاسخگویی عمومی و افزایش اثربخشی اقدامات حکمرانی از طریق بهبود تصمیمگیریها کمک میکند [۱۴]. از آنجایی که RCTها محور و مرکز ارزیابیهای خطمشی هستند، میتوان مزایایی را برای بکارگیری RCTها توسط نهادهای حکمران برشمرد:
۱) اولین و مهمترین مزیت بکارگیری RCTها هزینه کردن بودجه در خطمشیها و برنامههای مقرون به صرفه است. در شرایط متفاوت و یا برخی مسائل که منابع مالی کشور محدود است، اطمینان از اینکه آن منابع محدود در خطمشیها و برنامههای موثر، هزینه و سرمایهگذاری میشود، اهمیت مییابد. سیاستگذاران نیاز دارند با آگاهی کامل از اثربخشی خطمشیها و برنامهها، پیرامون آنها تصمیمگیری کنند. همچنین در شرایطی که سیاستگذاران بین دو یا چند پیشنهاد خطمشی و برنامه در یک حوزه خاص در ابهام باشند، نتایج RCTها پیرامون میزان اثربخشی هر یک از آنها میتواند کمک کند تا تصمیمگیری با سهولت بیشتری انجام شود و این اطمینان وجود داشته باشد که منابع کشور صرف آن خطمشی میشود که اثربخش و کارآمد است و میتواند اهداف مدنظر را محقق کند.
۲) دومین مزیت استفاده از RCTها ایجاد قدرت دفاع از تصمیمات خطمشی و افزایش اعتبار حاکمیت میباشد. مسئولین و سیاستگذاران و به طور کلی حاکمیت در خلا عمل نمیکنند زیرا باید از تصمیمات خود در برابر طیف وسیعی از ذینفعان از جمله مردم، گروهها، مشاغل و اصناف، سرمایهگذاران و غیره دفاع کنند. بکاربردن RCTها پیش از تصمیمگیری و اجرای خطمشیها میتواند این اطمینان را ایجاد کند که حاکمیت میتواند از تصمیمات و خطمشیهای اتخاذ شده دفاع کند زیرا شواهد واضحی از کارآمدی و اثربخشی و مقرون به صرفه بودن آنها در اختیار دارد که همین امر منجر به افزایش اعتبار حاکمیت خواهد شد. بنابراین در صورت داشتن شواهد، حاکمیت میتواند این اطمینان را به ذینفعان بدهد که خطمشی اتخاذ شده کارآمد و اثربخش است، ارزش هزینه کردن بودجه عمومی را دارد و از همه مهمتر انتظارات واقع بینانهای را در رابطه با اثربخشی خطمشیها در افکار عمومی ایجاد میکند [۱1].
۳) سومین مزیت بکارگیری RCTها این است که سبب اصلاح مستمر خطمشیها در جهت بهبود کارآیی آنها میشود. با توجه به اینکه کارکرد اصلی RCTها ارزیابی تاثیرات علّی است، اجرای آنها میتواند بینشهای بسیار خوبی به سیاستگذاران پیرامون دلایل و فرآیندهای موفقیت یا شکست یک خطمشی بدهد. همچنین از آنجایی که RCTها میتوانند ضمن ارزیابی کلی یک خطمشی و مقایسه خطمشیها، رویکردها و برنامههای گوناگون با یکدیگر، وجوه و جنبههای اثربخشی خطمشیها و برنامهها (حتی وجوه و جنبههای جزئی آنها) را نیز ارزیابی کنند، اجرای مستمر RCTها سبب اصلاح مستمر و دائمی خطمشیها خواهد شد و میتواند سیاستگذاران را به سمت شرایط و مداخلات اثربخشتر و بهینه کردن دائمی آنها راهنمایی کند [3].
۴) مزیت دیگر اجرای RCTها در خطمشیهای اجتماعی، دادن یک چشم انداز مطلوب برای پرداختن به موضوعات و رویکردهای سیاسی مناقشه برانگیز و با اختلاف نظر به کمک ارائه شواهد واقعی است. در حوزهها و موضوعاتی که بین سیاستگذاران اختلاف نظر وجود دارد که کدام خطمشی، رویکرد، برنامه یا مداخلهای موثرتر است، RCTها میتوانند توسط طرفهای مختلف مورد استفاده قرار گیرند و پیشنهادات گوناگون از طریق اجرای RCTها مورد ارزیابی قرار گیرد و میزان کارآمدی هر یک مشخص شود [6].
نهایتا میتوان گفت نهادهای حاکمیتی در موقعیت بسیار مناسبی برای اجرای RCTها قرار دارند. این نهادها عمدتا منابع قابل توجهی دارند و خطمشیها و مداخلاتی را اجرا میکنند که بر جمعیتهای بزرگی از مردم اثر میگذارد و میتواند تاثیرات پایداری بر کشور داشته باشد. با توجه به اینکه برای اجرای RCTهای خوب و قوی به جمعیتهای بزرگ نیاز است و نهادهای حاکمیتی به این جمعیتها دسترسی کافی دارند، میتوانند مرجع بسیار مناسبی برای اجرای RCTها باشند. همچنین از آنجایی که نهادهای حاکمیتی دادههای بسیار زیادی از شهروندان و رفتار آنها و نیز سایر اتفاقات جاری کشور در اختیار دارند، میتوانند با هزینه کم و با سهولت بیشتری نسبت به مجموعههای خصوصی، RCTها را اجرا کنند و اثربخشی تصمیمات و مداخلات را بسنجند [6].
3.تجربیات جهانی کاربرد کارآزماییهای تصادفی کنترل شده (RCTs)در حکمرانی
ریشههای استفاده از RCT در خطمشیهای عمومی به دهه ۱۹۲۰ برمیگردد. پیشرفتهای اولیه در استفاده از کارآزماییهای تصادفی کنترل شده در مطالعه خطمشیهای عمومی همزمان با استفاده آن توسط روانشناسی برای مطالعه رفتار انسان بود. در ابتدای دهه ۱۹۲۰ سیاستگذاران شروع به استفاده از آزمایش کردند و دانش آن را منتشر ساختند؛ مانند مطالعاتی برای بررسی تاثیر ارائه شیر در مدارس بر سلامتی کودکان که این مطالعات در ابتدا شکستهایی را تجربه کردند که ناشی از دانش ناکافی از اصول اجرای آزمایش و همچنین سختیهای اجرای آن بود، با این حال این مطالعات تا چند دهه بعد و حدودا تا سال ۱۹۳۹ ادامه پیدا کردند و بعد از آن دوباره بی استفاده ماند [۱2].
علاقه دوباره به استفاده از آزمایشهای میدانی به دهه ۱۹۶۰ ومطالعات کمپل بر روی ویژگیهای آماری آزمایشها برمیگردد. گسترش خطمشیهای رفاهی در دهه ۱۹۶۰ تقاضاها برای ارزیابی مستحکمتر خطمشیها را بیشتر کرد. در دهههای ۱۹۷۰ و ۱۹۸۰ مطالعات زیادی در حوزههایی چون بهزیستی، مالیات، محیط کار، جرم و جنایت و اشتغال با تمرکز بر دولت آمریکا صورت گرفت. یکی از رویدادهای مهم در این تاریخچه قانون فدرال اصلاحات علوم آموزشی در سال ۲۰۰۲ بود که در آن کنگره آمریکا بر استفاده از کارآزماییهای تصادفیسازیشده تاکید کرد و در نتیجه باعث رشد قابلتوجه کارآزماییهایی آموزشی در این کشور شد. علاقه فزاینده به RCTها باعث شد تا این ایده پیشنهاد شود که آزمایشهای سیاستی و اجتماعی، راهی موثر برای حکمرانی میباشد [۱2].
بکارگیری RCTها در خطمشیگذاریهای اجتماعی جهان در سالهای اخیر رشد بی سابقهای پیدا کرده است و در موضوعات مختلف اعم از جرم و عدالت، آموزش، رفاه اجتماعی، بهداشت، آموزش و غیره اجرا میشود. طبق بررسیهای کمپل از RCTهای با کیفیت انجام شده در جهان تا سال ۲۰۱۴، آمریکای شمالی در تولید RCTهای سیاستی پیشتاز است و رتبه اول در جهان را دارد. کانادا، انگلستان و استرالیا در رتبههای بعدی قرار دارند. قابل توجه اینکه در این لیست سه کشور در حال توسعه (هند، کنیا و مکزیک) نیز هستند که در خطمشیگذاریها از روش RCT استفاده میکنند [6]. در نقشه زیر کشورهای جهان را به تفکیک حوزه موضوعاتی که در آنها RCT انجام داده اند در سال ۲۰۱۶ نشان میدهند [۱3].
شکل ۳. نقشه استفاده کشورها از کارآزمایی تصادفی کنترل شده (RCTs) به تفکیک حوزه موضوعات
تقریبا سه چهارم RCTهای ثبت شده آمریکا توسط دولت به نهادهای دانشگاهی سفارش داده شده است و تعداد محدودی به طور مستقل توسط یک اداره دولتی انجام شده است. این نشان میدهد در آمریکا تخصص و اشتیاق زیادی برای انجام RCTهای سیاستی در دانشگاهها وجود دارد. همچنین در آمریکا بیش از ۵۰ درصد RCTها در حوزه بهداشت و سلامت و آموزش بوده اند (اما در سایر نقاط جهان توزیع موضوعی در سایر حوزههای سیاستی وجود دارد). دولت آمریکا به طور فعال از رشد RCTها حمایت زیادی میکند (برای مثال با تأسیس صندوقهای نوآوری اجتماعی و سرمایه گذاریهای اجتماعی این حمایتها را اعمال میکند). تیم علوم اجتماعی و رفتاری (SBST) آمریکا که در سال ۲۰۱۵ تأسیس شد، مداخلات بینشهای رفتاری را در دولت بکار میبرد و پیشرو در امر ارزیابیهای خطمشی و انجام RCTها است [6].
شناخته شده ترین مرجع انجام RCT در دولت انگلستان تیم بینشهای رفتاری (BIT) است که در سال ۲۰۱۰ در دفتر نخست وزیر به عنوان اولین موسسه بینشهای رفتاری جهان شروع به کار کرد و اکنون به طور منظم مداخلات رفتاری و RCTها را در حوزههای سیاستی گوناگون اجرا میکند. این تیم رویکرد اختصاصی «آزمایش، یادگیری و تطبیق» را برای اولین بار در سال ۲۰۱۲ ایجاد کرد [6] و در سال ۲۰۲۲ نیز رویکرد پیشرفتهتر TESTS را ایجاد کرد تا به طور سیستماتیکتر و ساختاریافتهتری از رویکرد شواهدمحوری در فرایند خطمشیگذاری استفاده شود [۱4]. همچنین طبق گزارشهای موجود، این تیم تا سال ۲۰۲۰ بیش از ۵۰۰ کارآزمایی تصادفی کنترلشده را در حیطههای گوناگون سیاستی طراحی و اجرا کرده است [۱5].
علاوه بر BIT، انگلستان همچنین شبکهای از مراکز What Works را ایجاد کرده است. این مراکز مستقل از دولت، شواهد به دست آمده از اثربخشی مداخلات در یک حوزه موضوعی خاص را ایجاد و گردآوری میکنند و آنها را به شیوهای در دسترس با دست اندرکاران، مسئولین و سیاستگذاران به اشتراک میگذارند [6]. این شبکه در حال حاضر شامل ۶ مرکز What Works است که مراکز دیگری نیز در حال پیوستن به این شبکه هستند. قدیمیترین و پرکارترین این مراکز، بنیاد وقف آموزش (EEF) است که مجموعهای از شواهد در حوزه آموزش را با هدف ارتقای کیفیت آموزش در انگلستان ایجاد کرده است و سه مرحله کارآزمایی را تأمین مالی و اجرا میکند: اول پایلوت (اصلاح مداخلهای که در مرحله اولیه یا توسعه است)، دوم کارآزماییهای کارآمدی (مشاهده اینکه یک مداخله تحت شرایط ایده آل چه قدر کارآمدی دارد) و سوم کارآزماییهای اثربخشی (مشاهده اینکه یک مداخله تحت شرایط واقعی و در مقیاس ملی چه قدر اثربخش است) [6]. سایر مراکز What Works این شبکه عبارتند از: موسسه ملی تعالی بالینی و سلامت (NICE)، موسسه کاهش جرم، موسسه رشد اقتصاد محلی، موسسه سالمندی بهتر و نهایتا موسسه مداخلات زودهنگام [7].
یکی دیگر از محورهای گسترش استفاده از RCTها در خطمشی عمومی، بکارگیری آن در کشورهای کمتر توسعه یافته و در موضوعات مرتبط با توسعه به ویژه در رابطه با ارزیابی برنامههای حمایتی از این کشورها است. برای مثال دو سازمانی که نقش موثر در این زمینه داشته اند، آزمایشگاه اقدام برای فقر عبداللطیف جمیل (J-PAL) و مرکز اقدام برای نوآوری فقر هستند [۱2]. بکارگیری این دسته از RCTها از حدود سال ۲۰۰۰ رایج شده است. برای مثال آزمایشگاه اقدام برای فقر عبداللطیف جمیل تا سال ۲۰۱۴، بیش از ۷۰۰ RCT را در کشورهای مختلف برای بررسی اثربخشی اقدامات مقابله با فقر و ارتقای رفاه اجرا کرده است [6]. نتیجه این کارها منجر به جایزه نوبل اقتصاد در سال ۲۰۱۹ شد که استر دافلو (بنیانگذار و مدیرعامل آزمایش اقدام برای فقر عبدالطیف جمیل)، آبیجیت بنرجی و مایکل کرامر بخاطر استفاده از رویکرد آزمایشی در حوزه فقر آن را دریافت کردند.
در ادامه برای نمونه به چند مورد از تجربیات جهانی استفاده از RCTها در خطمشیگذاری پرداخته میشود:
در سال ۲۰۰۳، وزارت کار و بازنشستگی (DWP) انگلستان یک RCT برای بررسی تأثیر سه برنامه جدید برای متقاضیان مزایای از کار افتادگی انجام داد تا بررسی کند کدام یک به این افراد کمک میکند بتوانند به بازار کار برگردند: اولین برنامه پیشنهادی مرتبط با حمایت در محل کار بود. دومین برنامه حمایت متمرکز بر نیازهای سلامت فردی افراد بود و سومین پیشنهاد ترکیبی از هر دو برنامه بود. لازم به ذکر است که طبق محاسبات هزینه حمایت و ارائه مزایای از کار افتادگی به طور متوسط برای هر نفر ۱۴۰۰ پوند بود. پس از انجام RCT، نتایج نشان داد که هیچ مزیتی نسبت به پشتیبانی استانداردی که از قبل در دسترس بود وجود ندارد یعنی مزایای اضافی از کار افتادگی بر روی افزایش بازگشت به کار این افراد تاثیری ندارد. لذا نتیجه RCT در نهایت سبب شد میلیونها پوند در هزینه دولت صرفهجویی شود، زیرا شواهد واضحی وجود داشت مبنی بر اینکه حمایت اضافی پرهزینه اثر مورد نظر را نداشته است [3]. این نمونه یکی از مثالهای طرحهای پرهزینهای است که در صورت بررسی اثربخشی نشان میدهند، سرمایه گذاری برای آنها مقرون به صرفه نیست.
مشارکت پرستار خانواده یک طرح پیشگیرانه برای مادران آسیب پذیر است. این طرح که در آمریکا توسعه یافته است شامل معاینات مرتب در خانه توسط پرستار آموزش دیده از ابتدای بارداری تا دو سالگی کودک است. چندین RCT مزایا و اثرات قابل توجهی را برای خانوادههای محروم و صرفه جویی قابل توجهی در هزینهها نشان داده اند. برای مثال این کودکان رشد اجتماعی-عاطفی بهتر، سلامت بیشتر، پیشرفت تحصیلی بهتر و انجام جرم کمتری داشتند. مادران دخیل در این طرح نیز سلامت بیشتری داشتند و احتمال بیشتری داشت شاغل باشند و کمتر درگیر جرم شدند. این طرح از سال ۲۰۰۷ آغاز شد و با توجه به نشان دادن اثربخشی آن توسط RCTهای متعدد، تصمیم گرفته شد طرح تا سال ۲۰۱۵ به دو برابر گسترش یابد و ۱۳۰۰۰ مادر را تحت پوشش قرار دهد [3]. این نمونه یکی از مثالهای سرمایهگذاری و گسترش یک طرح موفق مبتنی بر نتایج ارزیابیها است.
یکی از ابزارهای توسعه در دهه گذشته، اعتبارات خرد است. وامهای کوچک کارآفرینی با هدف ایجاد فرصتی برای حمایت از کارآفرینی مورد توجه قرار گرفته است. آمارها نشان میدهد بین ۱۵۰ تا ۲۰۰ میلیون وام گیرنده خرد در جهان وجود دارد. با این حال موجی از مشکلات در هند این فرضیه را ایجاد کرد که بانکهای خصوصی و بهرههای بالایی که در وام از مشتریان دریافت میکنند در این مسئله نقش دارد. اما بررسی کارآمدی و اثربخشی وامهای کارآفرینی نیاز به شواهد بیشتری دارد. در سال ۲۰۱۳ مجموعه RCTهایی در حیدرآباد هند بر روی وام گیرندگان یک بانک خصوصی که عمدتا در محلههای فقیر نشین بودند، انجام شد تا اثرات برنامههای اعطای وامهای کارآفرینی مشخص شود. ۱۵ تا ۱۸ ماه پس از انجام RCTها شواهد نشان داد که کارآفرینانی که وام دریافت کرده بودند، بیشتر در مشاغل خود سرمایهگذاری کردند و هزینههای بیشتری بر روی کالاهای بادوام انجام دادند. البته نتایج نشان داد که با دریافت وام هیچ افزایشی در تعداد کسبوکارهای راه اندازی شده یا سود شرکتهای موجود ایجاد نشد. همچنین هیچ تاثیری بر شاخصهای متعارف توسعه مانند هزینههای مصرف، بهداشت، آموزش یا توانمندسازی زنان دیده نشد. این نتایج لزوما به این معنی نبودند که اعتبارات خرد هیچ تاثیری نداشتند بلکه نشان داد ارائه وامهای کارآفرینی راهحل شگفت انگیزی به اندازهای که تصور میشود، نیستند [9].
3-4. ارائه مداخلات رفتاری بهینه ساز و اجرای RCT برای سنجش اثربخشی
به طور کلی تیمهای بینشهای رفتاری جهان که ملاخلات رفتاری را در خطمشیگذاریها طراحی و اجرا میکنند، پیشرو در اجرای RCTها برای بررسی اثربخشی مداخلات خود هستند. در ادامه به عنوان نمونه به نتایج کارآزماییهای چند مداخله رفتاری که توسط تیمهای بینشهای رفتاری اجرا شده است، اشاره میشود:
- افزایش درآمد مالیاتی: بسیاری از دولتها در سراسر جهان با استفاده از مداخلات رفتاری و ارزیابی اثربخشی توسط RCT درآمدهای مالیاتی خود را افزایش داده اند. برای مثال دولت انگلیس یک نامه مالیاتی مبتنی بر اصول رفتاری برای افرادی که هنوز مالیات خود را پرداخت نکرده بودند ارسال کرد. طبق شواهد به دست آمده از RCT همین نامه نرخ تمکین مالیاتی را تا ۱۵ درصد افزایش داد و سالانه ۳۰ میلیون پوند درآمد مالیاتی به دولت اضافه کرد [6].
- افزایش پرداخت عوارض: تیم بینشهای رفتاری (BIT) انگلستان یک RCT موفق را با استفاده از یاداورهای پیامکی مبتنی بر اصول رفتاری اجرا کرد تا مردم را تشویق کند عوارض خود را پیش از جریمه شدن پرداخت کنند. تعدادی از مداخلات مورد آزمایش قرار گرفتند که همگی به طور قابل ملاحظهای نرخ پرداخت را بهبود دادند. طبق نتایج کارآزمایی همین پیامک یادآوری سبب شد ۸۶۰ هزار پوند در هفته درآمد به صندوق دولت افزوده شود [6].
- افزایش اهدای عضو: در سال ۲۰۱۳ دولت انگلیس یک RCT آنلاین برای افزایش ثبت نام اهدای عضو با مشارکت تیم بینشهای رفتاری (BIT) اجرا کرد. در این کارآزمایی تاثیر هشت صفحه وب مبتنی بر اصول رفتاری بر روی افرادی که برای ثبت گواهینامه یا تمدید مالیات خودرو مراجعه میکردند، سنجیده شد. در ۵ هفته بیش از ۱ میلیون نفر از این صفحه بازدید کردند (هر نوع ۱۳۵۰۰۰ نفر). نتایج RCT نشان داد مشاهده این اصل رفتاری ساده که به شکل یک جمله ارائه شد بود، منجر به ۳۹ درصد ثبت نام بیشتر در طرح اهدای عضو شد. این معادل ۱۰۰۰۰۰ ثبت نام کننده اضافه اهدای عضو در سال در نتیجه افزودن یک جمله به یک صفحه وب بود [6].
- افزایش تزریق واکسن کرونا: در ایران نیز در سال ۱۴۰۰ کارآزمایی تصادفی کنترلشده ای توسط مرکز بینشهای رفتاری ایران و با همکاری وزارت بهداشت با هدف افزایش واکسیناسیون کووید-۱۹ انجام شد. در این کارآزمایی، پیامکهای یادآوری تزریق واکسن که مبتنی بر اصول علوم رفتاری طراحی شده بودند به افرادی که دوز دوم و سوم واکسن کرونای خود را دریافت نکرده بودند، ارسال شد. نتایج RCT نشان داد که ارسال پیامک رفتاری سبب افزایش ۳۷ درصدی تزریق دوز دوم واکسن و افزایش ۳۰ درصدی تزریق دوز سوم واکسن کرونا شد. پس از ارائه شواهد اثربخشی این مداخله کم هزینه بر روی افزایش نرخ واکسیناسیون کشور، این پیامک در مقیاس ملی برای افراد واکسن نزده ارسال شد. طبق محاسبات این مداخله رفتاری در کشور سبب جلو افتادن ۲۸ روز کشور در فرآیند واکسیناسیون شد [۱6].
در زمینه آموزش، بنیاد وقف آموزش (EEF) اخیرا یک جعبه ابزار آموزشی و یادگیری منتشر کرده است که توسط دانشگاهیان دانشگاه دورهام تهیه شده است. در این جعبه ابزار خلاصهای رایگان و در دسترس از بیش از ۵۵۰۰ مطالعه تحقیقاتی و RCT در اختیار معلمان و مدارس قرار گرفته است که از این منابع و شواهد برای بهبود پیشرفت دانش آموزان استفاده کنند. در واقع این مرکز What Works ماموریت دارد تا با تولید شواهد علمی متعدد و نیز منسجم کردن و پیوند آنها، شواهد علمی مورد نیاز در حوزه آموزش را از برنامهها و مداخلات موثر بر روی عملکرد دانش آموزان برای مدارس و معلمان فراهم کند. این جعبه ابزار به صورت رایگان در وب سایت Sutton Trust/EEF در دسترس است (البته قبلا به صورت اختصاصی برای معلمان ارشد در سراسر انگلستان منتشر شده بود). علاوه بر این جعبه ابزار، EEF همچنین در حال آزمایش ابتکارات نوآورانه برای بهبود پیشرفت دانش آموزان در سراسر انگلستان است. این آزمایشات تا سال ۲۰۱۳ بیش از ۲۷۵۰۰۰ دانش آموز و ۱۴۰۰ مدرسه را درگیر کرده بود [7].
در تصویر زیر نمونهای از صفحه این سایت قابل مشاهده است:
شکل ۴. جعبه ابزار معرفی شده توسط مرکز What Works با هدف معرفی موثرترین روشها در بهبود پیشرفت تحصیلی دانش آموزان انگلستان
4. ویژگیهای کارآزماییهای تصادفی کنترل شده (RCTs)
کارآزماییهای تصادفی کنترلشده (RCT) امروزه در جهان در حوزههای متنوعی اعم از خطمشیگذاری، توسعه بین المللی، تجارت و غیره مورد استفاده قرار میگیرند تا حدی که بعضا انجام ندادن آنها کاری غیرمعمول و اقدامی بیپروا تلقی میشود [3]. در این بخش به برخی از ویژگیهای RCTها میپردازیم که به نظر میرسد سبب شده تا اجرا و بکارگیری RCTها تا این اندازه گسترش یابد. پنج ویژگی کارآزماییهای کنترلشده تصادفی در ادامه مطرح میشوند:
4-1. کم هزینه بودن و مقرون به صرفه بودن RCT
اجرای RCTها عمدتا هزینه زیادی در پی ندارد. البته باید گفت هزینههای اجرای RCT به نحوه طراحی آنها نیز بستگی دارد. با برنامه ریزی اصولی میتوان RCTهایی با هزینه پایین طراحی کرد. این امر به ویژه زمانی صادق است که یک RCT بر یک بستر از پیش موجود اجرا شود. همچنین زمانی که از دادههایی استفاده میشود که به طور عادی در سیستمها ثبت میشوند، هزینهها کاهش مییابد. البته از جهت اینکه نتیجه RCT میتواند نشان دهد که یک خطمشی یا برنامه ارزش هزینه کلان کردن دارد یا خیر، هزینه کردن برای اجرای RCT قطعا مقرون به صرفه خواهد بود زیرا میتواند از صرف هزینه و بودجه در محلهای ناکارآمد جلوگیری کند و یا همچنین کمک کند بین چند برنامه موثر، بودجه به کارآمدترین برنامه تخصیص یابد. به طور کلی بهتر است به جای در نظر گرفتن هزینههای اجرای یک RCT به هزینههای عدم اجرای RCT توجه کرد [3]. تجربیات جهانی نشان داده است که حتی مهمترین و بزرگترین برنامههای اجتماعی و خطمشی را میتوان با صرف حداکثر ۱۰۰ هزار دلار انجام داد. طبق این تجربیات در صورتی که حداکثر ۲ درصد از بودجه هر برنامه و خطمشی به ارزیابی اثربخشی آن پیش از اجرا تخصیص داده شود، بودجه و منابع بسیار عظیمی برای برنامههای غیر موثر اتلاف نخواهد شد [15].
ارزیابی را با نتایج گوناگون یک مداخله میتوان سنجید. برای مثال اگر هدف یک مداخله ارتقای سطح تحصیلات در یک منطقه باشد، برای ارزیابی نتایج مداخله میتوان قصد افراد برای کسب تحصیلات بیشتر، ثبت نام بیشتر در مدرسه یا دانشگاه و یا فارغ التحصیلی در مدرسه یا دانشگاه را سنجید. در واقع ممکن است برخی نتایج برای آشکار شدن به چند سال زمان نیاز داشته باشند. لذا سرعت اجرای RCT وابسته به معیاری است که برای سنجش اثربخشی نتیجه یک مداخله انتخاب شده است که در نتایج طولانی مدت طبیعتا هر ارزیابی آینده همان میزان زمان را برای آشکار شدن نیاز دارد. البته این نکته نیز قابل ذکر است که همیشه نیاز نیست نتایج طولانی مدت سنجیده شود. در مواردی که نتایج کوتاه مدت یا میان مدت ارتباط نزدیکی با نتایج بلند مدت دارد، میتوان از آنها استفاده کرد و پاسخ سریعتری از نتایج RCT دریافت کرد [15]. برای مثال طرح حرکت به سمت فرصت، نمونهای است که نشان میدهد نتایج کوتاه مدت اثربخشی قابل قبولی نداشتند اما در نتایج بلند مدت شواهدی مبنی بر اثربخشی طرح وجود داشت. اواسط دهه ۱۹۹۰ در آمریکا یک مداخله با عنوان حرکت به سمت فرصت، به خانوادههای کمدرآمد یارانه مسکن برای کمک به نقل مکان به مناطق ثروتمندتر داده میشد. نتایج حاصل از این مداخله در ابتدا کمی ناامید کننده بود زیرا نمرات آزمونهای تحصیلی فرزندان این خانوادهها به طور قابل توجهی بهبود نیافته بود. اما شواهد طولانی مدتتر نتایجی متفاوت را نشان میداد. در سال ۲۰۱۵ RCTهایی بر روی این نمونه انجام شد. نتایج در سال ۲۰۱۵ و وقتی این کودکان حدودا ۲۰ ساله شده بودند، نشان داد کودکانی که زیر ۱۳ سال به مناطق مرفهتر نقل مکان کرده بودند، نرخ حضور در دانشگاه بالاتری به نسبت گروه کنترل داشتند، درآمدشان ۳۱ درصد بیشتر از گروه کنترل بود، در محلههای بهتری در بزرگسالی زندگی میکردند و احتمال کمتری داشت تک والد باشند. لذا این RCT نشان داد فراتر از نتایج فوری و کوتاه مدت، میتوان نتایج بلندمدت مداخلات و خطمشیها را نیز ارزیابی کرد و این به قدرت بیشتر سیاستگذاران در تشخیص برنامهها و خطمشیهای موثر کمک میکند [6]و [۱5].
4-3. ساده بودن و سهولت اجرای RCT
طراحی و اجرای RCTها عمدتا پیچیده یا دشوار نیستند. البته برای طراحی و اجرای با سهولت بیشتر آنها پشتیانی متخصصان و نیز همکاری مسئولین اجرایی مورد نیاز است. در صورتی که در مرحله طراحی یک RCT تلاش اولیهای برای اصولی پیش رفتن آن و بررسی جوانب در طراحی و اجرا صرف شود و این مورد در همکاری و تعامل بین متخصصان علمی و صاحبنظران و افراد با تجربه خطمشیگذاری و اجرایی انجام گیرد، اجرای آن با سهولت بیشتری انجام خواهد گرفت [3].
4-4. قابلیت تعمیم نتایج حاصل از RCT
با توجه به تفاوتهای موقعیتی، فرهنگی، اقتصادی و غیره بین گروههای مختلف مردم یک جامعه و نیز تغییر شرایط در زمانها و موقعیتهای گوناگون، اعتبار خارجی ارزیابیها و در واقع تعمیم پذیری آنها به طور کلی یک چالش است. اما با توجه به قابلیتهای RCT میتوان تا حد قابل قبولی تعمیمپذیری RCTها را افزایش داد. یکی از اقدامات لازم افزایش تعداد نمونه است. در واقع هرچه اجرای RCT بر نمونه تعداد بیشتری از افراد و نیز با در نظر گرفتن تنوع آنها در جامعه هدف انجام شود، نتایج RCT قابلیت تعمیم بیشتری پیدا میکند. برای مثال در صورتی که قصد سنجش اثربخشی یک طرح تشویقی بر روی صرفهجویی در مصرف انرژی وجود داشته باشد بهتر است نمونهای که RCT بر روی آنها میخواهد انجام شود شامل همه دهکهای اقتصادی جامعه و یا همه استانهای کشور باشد. همچنین RCTها قابلیت تکرار در حالات و شرایط گوناگون را دارند و میتوان از این قابلیت استفاده کرد و یک RCT را در زمینههای گوناگون تکرار کرد و از این تکرار نتایج قابل تعمیمی برای کل جامعه به دست آورد [۱5].
4-5. قابلیت استفاده از RCT در شرایط پیچیده و در حال تغییر
از RCTها حتی در شرایط پیچیده و در حال تغییر و در چالشهای اجتماعی و سیاستی دشوار میتوان استفاده کرد. دانش تخصصی طراحی و اجرای RCT این امکان را فراهم کرده است تا با طراحی مدلهای پیشرفته RCT مثل step wedge در شرایط پیچیده و یا در حال تغییر بتوان از RCTها برای ارزیابی اثربخشی برنامهها استفاده کرد. تجربیات موفق جهانی نیز که در چنین حوزهها و یا شرایطی RCTهای موفقیت آمیز و مفیدی اجرا کرده اند نیز میتوانند تایید کننده این ادعا باشند [۱5].
5.الزامات استفاده از ابزار کارآزمایی های تصادفی کنترل شده (RCTs)
کارآزماییهای تصادفی کنترلشده این ظرفیت را دارند که از نظر اقتصادی و خطمشیگذاری بینشهای ارزشمندی را پیرامون فعالیتهای حاکمیتی ارائه دهند. با این حال باید یک سری شرایطی فراهم باشد تا بتوان RCTها را طراحی و اجرا کرد. ویژگیهایی که باید وجود داشته باشند تا قابلیت اجرای RCT در حوزهای وجود داشته باشد عبارتند از:
1.برای نتایج اثربخش، معیارهای تعریف شده و قابل مشاهده وجود داشته باشد: برای اجرای یک RCT خوب لازم است تعریف عینی و مشخصی از اثربخشی وجود داشته باشد. یعنی پیش از اجرای یک RCT باید معیاری که موثر بودن یک مداخله را نشان میدهد تعریف شود و قابل مشاهده باشد [6]. برای مثال در سنجش اثربخشی طرح تشویقی فرزندآوری، یک معیار نتیجه مناسب، تعداد فرزندان به دنیا آمده است که قابل مشاهده و ردیابی و اندازهگیری میباشد و یک معیار نتیجه نامناسب میزان تمایل به فرزندآوری است که قابل مشاهده و سنجش عینی نیست.
2.جمعیتهای مورد آزمایش (حجم نمونه) به اندازه کافی بزرگ باشد: RCTهای با نمونه کوچک قدرت آماری و استنباطی کافی را ندارند. برای تمایز آماری بین گروههای مداخله و کنترل، نیاز به تعداد زیادی شرکت کننده در آزمایش وجود دارد [6]. انجمن AEA آمریکا نشان داده است که اکثر RCTهای سیاستی و اجتماعی بین ۱۰۰۰ تا ۱۰۰۰۰ شرکت کننده دارد. هر چند که RCTهای با نمونههای کوچکتر نیز عملی هستند اما هر چه تعداد نمونه بیشتر باشد، قدرت RCT و استنباط نتایج از آن بیشتر میشود. در سطوح مختلفی میتوان از جمعیت نمونه گرفت برای مثال نمونه میتواند در سطح فرد، خانواده، گروهها و حتی مناطق جغرافیایی باشد. برای داشتن حجم نمونه کافی میتوان در سطوح نمونه تغییراتی ایجاد کرد [6].
3.دادههای خوب و مناسب در حوزه مورد ارزیابی وجود داشته باشد: برخی از حوزههای سیاستی، به لحاظ دادههای در دسترس و مورد علاقه سیاستگذاران، غنی هستند (مانند مالیات، بهداشت و آموزش) در حالی که در برخی حوزهها و مسائل دادههای ثبت شده کمتری وجود دارد (مثل بیخانمانی یا برخی آسیبهای فرهنگی). RCTها در شرایطی که به دادههای با کیفیت بیشتری دسترسی وجود داشته باشد، عمدتا ًبه سهولت و با کیفیت بیشتری انجام میشوند[6].
4.مداخلات مورد استفاده استاندارد وجود داشته باشد: برای اینکه RCTها شواهد معنی داری در مورد اثربخشی ارائه دهند، همه شرکت کنندگان در گروه مداخله باید یک مداخله استاندارد و یکسان را در طول کارآزمایی دریافت کنند. مداخلاتی که استانداردسازی آنها دشوار است، ذاتاً برای سنجش اثربخشی دشوار هستند. برای مثال اجزای یک طرح تشویقی و نحوه ارائه آن باید برای تمام افراد گروه مداخله یکسان باشد. در صورتی که مداخله استاندارد و یکسان نباشد، نمیتوان نتیجه گیری کرد که اثر مشاهده شده به علت اجرای مداخله بوده است. همچنین اگر در طول کارآزمایی، مداخله تغییراتی داشته باشد نمیتوان متوجه شد که کدام بخش از مداخله موثر و کدام بخش غیرموثر بوده است [6].
5. زیرساختهای مناسب و افراد مسئول آگاه هر دو وجود داشته باشند: برای اجرای RCTهای موفق به دو عامل همزمان نیاز است. اولین عامل زیرساختهای مورد نیاز جهت اجرای RCT و دومین عامل افراد ذیربط و مسئولین و دستاندکاران آگاه و همراه است. در برخی سازمانها و یا حوزهها به دلیل بروکراسیهای فراوان، زیرساختهای ضعیف و قدیمی امکان اجرای مداخلات و سنجش اثربخشیها بسیار دشوار است و هرچه این زیرساختها بهتر فراهم باشد، با قوت بیشتری میتوان RCTها را اجرا کرد. همچنین فراتر از زیرساختها، به مسئولین و افرادی نیز در نهادها نیاز است تا به ارزش RCTها و اهمیت آنها در فرایند خطمشیگذاری آگاه باشند و افرادی توانمند و با انگیزه برای کمک به اجرای RCTها باشند [6].
در این بخش به پنج ویژگی برای اجرای موفقیتآمیز RCTها اشاره شد. اما این نکته نیز ضروری است که در برخی موضوعات یا حوزههای سیاستی استفاده از RCTها غیرممکن و نامناسب است که در این موارد باید از روشهای ارزیابی دیگر استفاده کرد. دو عاملی که اغلب استفاده از RCTها را منع میکنند عبارتند از عدم امکان داشتن گروه کنترل و حجم نمونه خیلی کوچک. در برخی موضوعات جدا کردن گروه کنترل اصلا امکان پذیر نیست و یا غیراخلاقی است. برای مثال سود وام بانکی را نمیتوان برای گروه مداخله متفاوت از گروه کنترل تعیین کرد و لذا نمیتوان دو گروه مداخله و کنترل داشت. همچنین در برخی موارد جامعه هدف بسیار کوچک است و نمیتوان از آن جامعه کوچک نمونه به اندازه کافی بزرگ گرفت و آن را تخصیص تصادفی داد. مثلا در شرایطی که هدف ما بررسی اثربخشی مداخله بر روی والدین روستایی باشد که فرزندی به سرپرستی گرفته اند. لذا علیرغم کاربردهای بسیار زیاد این روش، توجه به این محدودیتها نیز مهم است [6].
6.راهنمای عملی استفاده از ابزار کارآزمایی های تصادفی کنترل شده (RCTs)
با همراهی متخصصان، حمایت مسئولان و خط مشی گذاری مناسب، راه اندازی RCTها بسیار کم هزینه تر و ساده تر هستند از آنچه اغلب تصور میشود. در این بخش مراحلی مطرح میشود که برای راه اندازی هر RCT لازم است. این مراحل طبق چارچوب «آزمایش، یادگیری و تطبیق» تیم بینشهای رفتاری انگلستان (BIT)معرفی میشود که در سال 2۰12 ارائه شد. طبق این چارچوب، ۹مرحله جداگانه در اجرای یک RCTوجود دارد که در این بخش تشریح میشود. همچنین به حوزه هایی اشاره خواهد شد که در آن سیاستگذار ممکن است بخواهد به دنبال مشاوره تخصصی بیشتر باشد [3].
آزمایش
مرحله ۱: دو یا چند مداخله خطمشی را برای مقایسه شناسایی و انتخاب کنید.
زمانی که عدم اطمینان پیرامون اثربخشی دو یا چند مداخله وجود دارد، RCTها انجام میشوند. در واقع مبنای اصلی RCTها مقایسه مداخلات با یکدیگر است. اغلب RCTها در جهان نیز برای مقایسه یک مداخله و برنامه جدید در برابر برنامه فعلی انجام میشود. این مداخله جدید میتواند یک تغییر کوچک یا مجموعهای از تغییرات کوچک در عملکرد فعلی باشد یا میتواند یک برنامه کاملا جدید باشد که در کشور یا زمینهای دیگر موفق عمل کرده و یا دارای پشتوانه نظری مناسبی است. در این مرحله این نکته نیز حائز اهمیت است که مداخلهای که برای اجرای RCT انتخاب میشود نباید یک مداخله خطمشی ایده آل و بینقص باشد و باید دقیقا همان مداخلهای باشد که در صورت نشان دادن نتایج اثربخش بناست در مقیاس کل کشور اجرا شود.
مرحله ۲: نتیجهای را که مداخله خطمشی قصد دارد بر آن تاثیر بگذارد و نحوه سنجش آن در آزمایش را تعریف کنید.
در هر RCT بسیار مهم است که در همان ابتدا بدانیم دقیقا به چه نتیجهای میخواهیم دست بیابیم و چگونه بناست آن نتیجه را اندازهگیری کنیم. برای مثال در یک خطمشی کنترل مصرف انرژی، معیار نتیجه میتواند میزان مصرف خانگی انرژی باشد. در این مرحله مهم است پیش از اجرای RCT در مورد چگونگی و زمان اندازهگیری نتایج تصمیمگیری کنیم و در مرحله تحلیل نتایج به آن پایبند باشیم. همچنین بسیار مهم است که اطمینان حاصل شود که روش اندازهگیری نتایج برای همه گروهها دقیقا یکسان است. علاوه بر این در هنگام تصمیم گیری پیرامون معیار نتیجه این مهم است که نتیجهای را که واقعا به آن اهمیت میدهید انتخاب کنید و در واقع نتیجه قابل سنجش هر چه به هدف واقعی نزدیکتر باشد بهتر است. اما در صورتی که هدف نهایی قابل سنجش نباشد، میتواند از «نتیجه جایگزین» استفاده کرد. برای مثال در ارزیابی یک خطمشی که هدف کاهش ارتکاب جرم را دارد، شاید میزان واقعی ارتکاب جرم را پس از اجرای مداخله نتوان سنجید و در عوض میزان افراد دستگیر شده پس از ارتکاب جرم را به عنوان نتیجه جایگزین انتخاب کرد. این سوال که در هر RCT کدام معیار نتیجه مناسبتر است بهتر است از تعامل بین متخصصین RCT (که میدانند چه نتیجهای از نظر فنی و تخصصی مناسبتر است) و نیز سیاستگذاران (که میدانند چه نوع دادهای قابل دسترستر است و هزینه جمعآوری آن کمتر است) حاصل شود.
مرحله ۳: پیرامون واحد تصادفی سازی تصمیمگیری کنید.
پس از بررسی اینکه چه نتیجهای را اندازهگیری کنیم، باید تصمیم بگیریم که چه کسی یا چه چیزی را تصادفی کنیم. این موضوع به عنوان واحد تصادفی سازی شناخته میشود. واحد تصادفی سازی اغلب افراد هستند. برای مثال زمانی که خطمشی یا برنامهای را برای پایبندی بیشتر به قانون حجاب ارزیابی میکنیم. با این حال، واحد تصادفی سازی میتواند گروهی از افراد یا موسسات نیز باشد. برای مثال زمانی که قصد ارزیابی طرحی را برای افزایش پرداخت مالیات شرکتها داریم که در این شرایط واحد تصادفیسازی میتواند شرکتها باشد. در نهایت واحد تصادفی سازی حتی میتواند مناطق جغرافیایی باشد. برای مثال زمانی که مداخلهای را برای تشویق مردم به بازیافت زباله میخواهیم مورد ارزیابی قرار دهیم، واحد تصادفیسازی ما میتواند مناطق شهری باشد. این سوال که در هر RCT واحد تصادفی سازی بهتر است افراد، موسسات یا مناطق باشد، معمولا بستگی به ملاحظات عملیاتی آن کارآزمایی دارد که مشاوره با یک متخصص میتواند در این زمینه کمک کننده باشد.
مرحله ۴: تعیین کنید چه حجم نمونهای برای دریافت نتایج قوی مورد نیاز است.
برای نتیجهگیری اثربخشی یک خطمشی از RCTها، کارآزمایی باید با حجم نمونه کافی اجرا شود. اگر حجم نمونه به اندازه کافی بزرگ باشد، میتوانیم مطمئن باشیم که اثر مداخله بعید است دلیل شانس بوده باشد. اگر واحد تصادفی سازی موسسات یا مناطق باشد، به احتمال زیاد به حجم نمونه بیشتری نیاز خواهیم داشت. محاسبات آماری در تعیین اینکه چه حجم نمونهای مورد نیاز است تا گروههای مداخله و کنترل مورد بررسی قرار گیرند، کمک میکند. این محاسبات میتواند با کمک متخصصین RCT انجام شود. این نکته نیز قابل ذکر است که اگر مداخله اثرات بزرگی داشته باشد، آزمایش با نمونه کمتر نیز میتواند اثرات را نشان دهد (اندازه اثر بزرگ) اما برای تشخیص اثرات و تفاوتهای ظریفتر به تعداد بیشتری نمونه نیاز است (اندازه اثر کوچک). با توجه به اینکه اکثر مداخلات خطمشی، اندازه اثرهای کوچک دارند و نیز با توجه به اینکه گاهی تشخیص حتی تفاوتهای کوچک بسیار مفید است، پیشنهاد میشود در صورت عدم افزایش زیاد هزینه، حجم نمونه بزرگتری انتخاب شود.
مرحله ۵: هر واحد را با استفاده از روش تصادفیسازی به یکی از مداخلات خطمشی اختصاص دهید.
تخصیص تصادفی واحدهای مطالعه به گروههای مداخله و کنترل، گام کلیدی است که RCT را نسبت به سایر انواع ارزیابی خطمشی برتری میدهد. این کار ما را قادر میسازد تا مطمئن باشیم که گروه مداخله و کنترل در همه خصوصیتها معادل یکدیگر هستند. به عنوان مثال در زمینه خطمشیهای آموزشی این خصوصیتها میتواند شامل وضعیت اجتماعی-اقتصادی، جنسیت و غیره باشد. روشهای تخصصی زیادی برای این تخصیص تصادفی وجود دارد که در اختیار متخصصان است.
مرحله ۶: مداخلات خطمشی را به گروههای اختصاص داده شده ارائه کنید.
هنگامی که طبق مراحل قبل افراد، موسسات یا مناطق به طور تصادفی به یک گروه مداخله و کنترل تخصیص داده شدند، زمان آن است که مداخله خطمشی را به آنها ارائه کنیم (برای مثال طرح تشویقی فرزندآوری را به افراد گروه مداخله معرفی کنیم). یکی از ملاحظات مهم در این مرحله، وجود سیستمی برای نظارت بر مداخله است تا اطمینان حاصل شود که به روشی مطلوب، استاندارد و یکسان، مداخله به همه آنها ارائه شده است.
یادگیری
مرحله ۷: نتایج را اندازهگیری کنید و تاثیر مداخله خطمشی را تعیین کنید.
پس از ارائه مداخله باید نتایج را اندازهگیری کنیم. زمان و روش اندازهگیری نتایج در مرحله ۲ تصمیمگیری شده بودند. این زمان بستگی به این دارد که فکر کنیم مداخله با چه سرعتی میتواند اثرگذار باشد که برای هر مداخله متفاوت است. برای مثال اگر مداخله به صورت پیامکی است، باید که صبح انتخابات برای مردم ارسال میشود تا تشویق به مشارکت در انتخابات شوند، طبیعتا این مدت زمان ۲۴ ساعت است و پس از آن میتوان نتایج را اندازهگیری کرد اما در صورتی که مداخله مربوط به تشویق فرزندآوری باشد حداقل یک سال میتوان بازه اندازهگیری نتایج را معین کرد. همچنین این نکته نیز قابل ذکر است که علاوه بر جمع آوری دادههای مربوط به نتیجه اصلی، جمع آوری دادههای فرایندی و سایر دادههای جانبی حاصل از مداخله نیز میتواند مفید باشد و به توضیح نتایج کمک کند و یا بینشهای جدیدی ارائه دهد. این یافتههای ثانویه را نمیتوان با همان قطعیت نتایج اصلی تفسیر کرد اما میتوان از آنها برای ایجاد فرضیات جدید برای کارآزماییهای بعدی استفاده کرد. علاوه بر این بسیاری از کارآزماییها شامل جمع آوری دادههای کیفی برای کمک به توضیح یافتهها، حمایت از اجرای آینده، راهنمای تحقیقات بیشتر و یا بهبود مداخله هستند. این مورد ضروری نیست اما در صورت انجام تحقیقات کیفی شرایط ایده آلی ایجاد میشود زیرا ممکن است با این کار اطلاعات بیشتری در دسترس قرار گیرد.
تطبیق
مرحله ۸: مداخله خطمشی را طبق نتایج به دست آمده، تطبیق دهید.
به دست آوردن نتایج مثبت از اثربخشی مداخلات عموما قابل قبولتر از به دست آوردن نتایج منفی و یا بی نتیجه بودن اثر مداخلات است. یعنی عمدتا افراد انتظار دارند مداخله موثر باشد تا اینکه بی اثر باشد یا اثر منفی داشته باشد. اما این نکته قابل توجه است که کارآزمایی که بی اثر بودن یا اثر منفی مداخله را نشان میدهد به همان اندازه ارزشمند است که اثربخش بودن مداخله را نشان دهد. برای مثال اگر بفهمیم ارائه مزایای بیمه سبب بهبود سلامت افراد نمیشود (یعنی نتیجه کارآزمایی بی اثر باشد) میتوانیم منابع عمده حاکمیت را صرف کاری نکنیم که بی اثر است و هزینههای گزافی نیز به بار میآورد. لذا در مداخلاتی که نشان داده شده بی اثر هستند، میتوان سرمایه گذاری بر روی آنها را غیرمنطقی در نظر گرفت و بودجه پس انداز شده را در جای دیگر و بر روی مداخلات موثرتر هزینه کرد. همچنین در این مرحله لازم است یافتههای حاصل از کارآزمایی ثبت و منتشر شوند تا سایر نهادهای دولتی نیز از نتایج آن بتوانند استفاده کنند.
مرحله ۹: به مرحله اول بازگردید تا به طور مداوم درک خود را از آنچه موثر است را بهبود بخشید.
به جای اینکه RCT را ابزاری برای ارزیابی یک برنامه مشخص در یک مقطع زمانی معین بدانیم، بهتر است که RCTها را به عنوان بخشی از فرآیند مستمر نوآوری و بهبود خطمشیها در نظر بگیریم. تکرار نتایج یک کارآزمایی به ویژه در زمانی مهم است که مداخله را بخواهیم در زمانی دیگر و یا به جمعیتی دیگر ارائه کنیم. همچنین استفاده از یافتههای آزمایشی مستمر برای شناسایی راههای جدید برای بهبود دائمی نتایح مفید است. همچنین انجام مستمر RCTها برای تشخیص اینکه کدام یک از جنبههای یک خطمشی موثرتر است، میتواند مفید باشد. بهبود مستمر خطمشیها مهمترین جنبه روش شناسی چارجوب «آزمایش، یادگیری و تطبیق» است زیرا فرض میکند همیشه فضا برای بهبود کارآمدی خطمشیها وجود دارد و هرگز ما آگاه به تمام زوایای حوزههای سیاستی و رفتار مردم نیستیم.
7.ضرورت ظرفیتسازی در راستای کاربست کارآزماییهایتصادفی کنترلشده (RCTs)
در زمانی که نهادهای حکمرانی شروع به استفاده از RCTها کردند، به این نکته باید توجه شود که نباید در یک RCT متوقف شد و باید جریانی از RCTها ایجاد کرد و در واقع اکوسیستم شواهد را در کشور پایه گذاری کرد و به شواهد به شکل جزء جداناشدنی از فرایند خطمشیگذاری نگریست. همچنین به طور کلی باید یافتههای مثبت و منفی RCTها را پذیرفت زیرا مجموعه آن نتایج است که حاکمیت نیاز دارد تا به طور موثر اولویتها و تصمیمگیریهای خطمشی را از آنچه ناکارآمد و غیر موثر است به آنچه موثر و اثربخش و کارآمد است، تغییر دهد [6].
فرصتهای اجرای RCT فراوان هستند اما تبدیل شدن اجرای RCTها در کشور به عنوان یکی از بخشهای ضروری فرایند خطمشیگذاری نیازمند ایجاد ظرفیت و فراهم شدن شرایط لازم است. در این بخش سه ظرفیت حیاتی را برای استفاده از این فرصتها مطرح میکنیم. در واقع اگر این سه ظرفیت فعال شوند، میتوان امید داشت که در حکمرانی کشور از شواهد به نحو موثر استفاده خواهد شد. این سه ظرفیت شامل فرهنگ و رهبری، تجربه و تخصص و نهایتا شفافیت است. در ادامه به هر یک جداگانه به صورت مختصر پرداخته میشود:
بررسیهای جهانی نشان داده اند که بزرگترین ظرفیت ایجاد کننده خطمشیگذاری مبتنی بر شواهد، فرهنگ سیاسی و رهبری است. RCTها نیازمند فرهنگی هستند که طبق آن سیاستگذاران باور داشته باشند که با شهود نمیتوان به کارآمدی یا عدم کارآمدی خطمشیها، برنامهها و مداخلات پی برد. طبق گفته دیوید هالپرن، فرهنگ سیاسی و سیاستگذاران باید به گفتن «نمیدانیم اما میدانیم چطور میشود فهمید» عادت کنند. در واقع فرهنگ سیاسی باید به این باور برسد که هر چند به صورت شهودی نمیدانیم چه چیزی کارآمد است اما میتوانیم آزمایش کنیم، یاد بگیریم و تطبیق دهیم و این فرایند را با سرعت به سرانجام برسانیم. برداشتن اولین قدم برای شروع خطمشیگذاری شواهد محور نیاز به اعتماد دارد. نهادها باید اعتماد کنند که مسئولین از آنها حمایت خواهند کرد تا بتوانند از آزمایشها درس بگیرند. مسئولین نیز باید اعتماد کنند که شکست سریع و کوچک هوشمندانهتر است به نسبت اینکه وانمود کنند که شکست غیر ممکن است. شهروندان نیز باید اعتماد کنند که حاکمیت از این آزمایشها درس خواهد گرفت و به سمت بهبود خطمشیها حرکت خواهد کرد.
نکته قابل توجه بعدی این است که ایجاد خطمشیگذاری شواهد محور نیاز زیاد به حمایت مسئولین حاکمیتی دارد. دستورالعملهایی که انجام RCT را جزء جداناشدنی از فرایند خطمشیگذاری میدانند، تخصیص بودجه برای انجام RCTها پیش از تصمیمگیریهای نهایی، دادن مجوزها و دسترسیهای لازم برای انجام RCTها همه صرفا بر عهده مسئولین است تا این رویکرد خطمشیگذاری شواهد محور در حکمرانی کشور مورد استفاده قرار بگیرد. نهایتا مهمترین عامل ایجاد ظرفیت برای رویکرد خطمشیگذاری شواهد محور، شوق و تعهد مسئولین است که RCTها را جزو اصلی ترین ورودیها و مبناهای خود برای تصمیمگیریها و خطمشیگذاریها بدانند [6].
استفاده از تجربه و تخصص افراد با تجربه و متخصص در زمینه روشهای شواهد محور و RCTها یکی از ظرفیتهای مهم برای ایجاد رویکرد خطمشیگذاری شواهدمحور در کشور است. با توجه به اینکه انجام RCTها نیاز به تجربه و تخصص دارد، همچنین با توجه به تجربیات جهانی بکارگیری خطمشیگذاری شواهد محور پیشنهاد میشود که مراکزی به صورت متمرکز مسئولیت و نقش ارائه خدمات مرتبط با ارزیابیهای خطمشیها و RCTها را برعهده بگیرند. این مراکز متمرکز چند وظیفه برعهده دارند. اولاً استانداردهای ارزیابی واحدی را در سراسر حاکمیت تعیین و ایجاد میکنند که بار را برای بخشهای جداگانه که قصد انجام دارند کاهش میدهد و احتمال ارزیابیهای بیکیفیت را پایین میآورد؛ ثانیاً این مراکز خطمشیگذاری مبتنی بر شواهد را ترویج میکنند و بر آنها نظارتها و هماهنگیهای لازم را انجام میدهند؛ ثالثا منابع مورد نیاز را اعم از تخصص فنی، سرمایه انسانی و غیره فراهم میکنند. علاوه بر اینها میتوان گفت، به طور کلی این مراکز سه کارکرد دیگر را نیز بعهده دارند: تولید شواهد، ترجمه شواهد و تسهیل جذب شواهد. این مراکز به تولید و نیز جمع آوری شواهد از سراسر جهان مشغول هستند و سپس شواهد تولید شده و یا ترکیب شده را طبق نیاز خطمشیگذاری و مسائل آن ترجمه میکنند و با معیارهای مشترک ارزش آنها را معین مینمایند و نهایتاً جذب شواهد توسط نهادهای خطمشیگذاری را تسهیل میکنند؛ یعنی کمک میکنند تا شواهد به دست مسئولین و سیاستگذارانی که به آنها نیاز دارند برسد و آنها را در تصمیمگیریها بکار ببرند [7].
طبق تجربیات جهانی این مرکز متمرکز میتواند در قالب ساختارهای متفاوتی فعالیت کند. برخی از این مراکز ذیل نهادهای حاکمیتی و وابسته به آنها مشغول به فعالیت هستند و کارمندان آنها کارمندان دولت هستند و با یک ستاد مرکز به یکدیگر متصل هستند و در واقع شبکهای از کارشناسان و منابع را فراهم میکنند و نیازهای ارزیابی و شواهدمحوری نهادهای حاکمیتی را رفع میکنند. نوع دوم مراکز متخصص و متمرکز کاملا مستقل از حاکمیت هستند که از بخشهای مختلف حاکمیت جهت ارزیابی خطمشیها سفارش دریافت میکنند. در نوع سوم مرکزی متمرکزی وجود ندارد و هر بخش حاکمیت بسته به نیازهای ارزیابی به صورت پراکنده متخصصین، کارشناسان و مشاورین را به کار میگیرد و نیازهای مرتبط را بدین صورت رفع مینماید. نهایتا فارغ از تاسیس مراکز متمرکز با مسئولیت اجرای رویکرد شواهد محور، مشارکت دانشگاهیان نیز برای ظرفیت سازی این رویکرد بسیار مهم است. با ایجاد روابط قابل اعتماد بین حاکمیت و جامعه دانشگاهی، دسترسی به منبع بزرگی از دانش ارزیابی خطمشی ارتقا مییابد [6].
عدم شفافیت ارزیابیها، اعتبار آنها را کاهش میدهد. به طور کلی بدبینی قابل پیش بینی در مورد ارزیابی حاکمیت از خطمشیهای خود وجود دارد. یکی از راهحلهای این مورد، ایجاد شفافیت و ثبت نتایج کارآزماییها و ارزیابیهای خطمشیها است. این رویکرد مستلزم آن است که سیاستگذاران برای نشان دادن تاثیرات کم یا عدم تاثیر برنامهها آماده باشند. تحلیل نتایج پایگاه داده مرکز What Works بنیاد وقف آموزش انگلستان نشان داد که از ۴۵ کارآزمایی اجرا شده تنها ۱۱ کارآزمایی دارای نتیجه مثبت و از نظر آماری معنی دار بودند. مرکز SBST آمریکا نیز تمام کارآزماییهای با نتایج منفی یا بیتاثیر خود را منتشر میکند. نکته مهم این است که انتشار این نتایج به اندازه انتشار نتایج مثبت مهم است. دانستن اینکه چه کاری نباید انجام شود به اندازه دانستن اینکه چه کاری باید انجام شود، مفید است. ثبت نتایج علاوه بر افزایش اعتبار نتایج سبب میشود تا بخشهای مختلف حاکمیت به نتایج آزمایشها دسترسی داشته باشند و برای سایر کارهای خود بتوانند از آنها استفاده کنند. در واقع هرچه مجموعه دادههای موجود با یکدیگر پیوستگی و پیوند بیشتری داشته باشند و نهادهای مختلف به شبکه آن شواهد دسترسی بیشتری داشته باشند، ظرفیت گسترش رویکرد خطمشیگذاری شواهد محور افزایش پیدا میکند [6].
8.کاربست کارآزماییهای تصادفی کنترل شده (RCTs) در مجلس شورای اسلامی
امروزه در سطح جهان قانونگذاری شواهد محور و کاربرد RCTها در خطمشیگذاری و قانونگذاری در حال گسترش است و از طرفی فشار فزایندهای در نهادهای حکمرانی وجود دارد تا نشان دهند خطمشیها و قوانین، اثربخش هستند. این تلاش برای اثبات اثربخشی خطمشیگذاریها میتواند سبب افزایش کارآمدی و مسئولیت پذیری در سطح حکمرانی شود. قانونگذاران در کشورهای مختلف برای ترویج رویکرد شواهد محور و استفاده از کارآزماییهای تصادفی کنترل شده، قوانینی وضع میکنند و ساختارها و فرایندهایی ایجاد میکنند تا این رویکرد در حکمرانی آنها با سهولت بیشتری مورد استفاده قرار گیرد. برای نمونه در آمریکا قوانینی با ۵ رویکرد وضع شد تا خطمشیگذاری و قانونگذاری مبتنی بر شواهد را ارتقا دهد. این ۵ رویکرد عبارت اند از: ۱- طبقه بندی برنامهها بر اساس شواهد موجود توسط نهادهای تخصصی وابسته ۲- ایجاد انگیزه برای استفاده از برنامههای مبتنی بر شواهد و تحقیق ۳- محدود کردن بودجه برنامههای بی اثر طبق نتایج شواهد ۴- نیاز به استفاده از برنامههای مبتنی بر شواهد و تحقیق ۵- تخصیص بودجه به برنامههای مبتنی بر شواهد و تحقیق [۱7]. بنابراین طبق تجربیات جهانی، کاربست رویکرد شواهد محور و استفاده از کارآزماییهای تصادفی کنترل شده نیاز به طراحی راهبردی و برنامه ریزی دارد تا بتواند در نظام قانونگذاری ایران نیز ترویج شود.
علاوه بر تجربیات جهانی از خطمشیگذاری حول ترویج رویکرد شواهد محور و کاربست کارآزماییهای تصادفی کنترل شده، در اسناد بالادستی کشور نیز میتوان مویداتی بر اهمیت استفاده از این رویکرد پیدا کرد. بند نهم «سیاستهای کلی نظام قانون گذاری» مطرح میکند: «رعایت اصول قانونگذاری و قانوننویسی و تعیین سازوکار برای انطباق لوایح و طرحهای قانونی با تاکید بر: ۱- قابل اجرا بودن قانون و قابل سنجش بودن اجرای آن ۲- معطوف بودن به نیازهای واقعی ۳- شفافیت و عدم ابهام ۴- استحکام در ادبیات و اصطلاحات حقوقی ۵- بیان شناسه تخصصی هر یک از لوایح و طرحهای قانونی و علت پیشنهاد آن ۶- ابتناء بر نظرات کارشناسی و ارزیابی تأثیر اجرای قانون ۷- ثبات، نگاه بلندمدت و ملی ۸- انسجام قوانین و عدم تغییر یا اصلاح ضمنی آنها بدون ذکر شناسه تخصصی ۹- جلب مشارکت حداکثری مردم، ذینفعان و نهادهای قانونی مردمنهاد تخصصی و صنفی در فرآیند قانونگذاری ۱۰- عدالت محوری در قوانین و اجتناب از تبعیض ناروا، عمومی بودن قانون و شمول و جامعیت آن و حتیالامکان پرهیز از استثناهای قانونی». لذا طبق بند نهم «سیاستهای کلی نظام قانونگذاری» در قانونگذاریها باید از قابل اجرا بودن قانون، قابل سنجش بودن قانون و ابتناء بر نظرات کارشناسی و ارزیابی تأثیر اجرای قانون اطمینان حاصل کرد و سازوکارهای لازم را جهت اعمال این موارد فراهم ساخت.
طبق اصل (۸۵) قانون اساسی، قانونگذار وضع قانون آزمایشی را امکان پذیر ساخته است. از آنجایی که قانون آزمایشی، قبل از قطعیت قانون و با مدت اعتبار محدودی اجرا میشود، حاکی از آزمون و خطا در امر تقنین است. در واقع قانون آزمایشی به مدت محدود اجرا میشود تا با آزمون و خطا نقاط ضعف و قوت آن استخراج گردد و اثربخشی آن ارزیابی شود تا در نهایت در خصوص سرنوشت آن تصمیم گیری شود. نکته قابل ذکر این است که طبق توضیحاتی که پیشتر ارائه شد، در صورتی که ارزیابی انجام شده از اجرای قانون آزمایشی مبتنی بر آزمایش تصادفی و با گروه کنترل نباشد (RCT)، به لحاظ علمی نمیتوان تاثیر مشاهده شده از اجرای قانون آزمایشی را به قانون نسبت داد زیرا هر چند این تاثیر مشاهده شده واقعی (و نه تحت تاثیر سوگیری خودتاییدی) باشد، اما میتواند تحت تاثیر سایر عوامل متعدد زمینهای ایجاد شده باشد و بدین ترتیب نمیتوان استنباط علّی انجام داد و تاثیر مشاهده شده را به قانون آزمایشی اجرا شده نسبت داد. بنابراین هر چند که قانونگذاری آزمایشی روشی مرسوم در جهان است و مزایای مخصوص به خود را دارد اما استفاده از روش کارآزمایی تصادفی کنترل شده میتواند در برخی موارد راه حل مکملی باشد که در موارد دارای ابهام به جای آزمون و خطا و دادن هزینه و اتلاف منابع و زمان، با اجرای قانون بر روی نمونهای کوچکتر اما نماینده جامعه بتوان به اثربخشی و کارآمدی قانون پی برد و پیش از اجرا آن را ارزیابی نمود و نهایتا مبتنی بر شواهد به دست آمده پیرامون آن تصمیم گیری کرد.
نهایتا اینکه طبق ماده(۱۲۷) قانون «آیین نامه داخلی مجلس شورای اسلامی» لازم است طرحها و لوایح پیشنهادی دارای دلایل توجیهی کافی باشند. از آنجایی که موثرین و دقیق ترین دلایل توجیهی اثربخشی طرحها مبتنی بر کارآزماییهای تصادفی کنترل شده به دست میآیند، استفاده از این روش میتواند کمک بسزایی در تحقق این امر نماید. همچنین طبق ماده (۱۴۱)و (۱۴۲) این آیین نامه مرکز پژوهشهای مجلس در تعاملی با کمسیون تخصصی به اظهار نظر کارشناسی میپردازد. یکی از مهمترین شواهد تخصصی بر اثربخشی و مطلوبیت طرحها، نتایج کارآزماییهای تصادفی کنترل شده هستند. لذا مرکز پژوهشهای مجلس میتواند با بکارگیری روش کارآزمایی تصادفی کنترل شده، نتایج متقنی را از اثربخشی و کارآمدی طرحها و لوایح به کمسیونهای تخصصی ارائه کند.
علاوه بر اسناد بالادستی ذکر شده، در دو گزارش پیشین مرکز پژوهشهای مجلس تا حدی به مسئله قانونگذاری شواهد محور توجه شده است. گزارش اول با عنوان «راهکارهای کاهش سوگیریهای شناختی به منظور ارتقای کیفیت تصمیمگیری مجلس شورای اسلامی» به سوگیریهای شناختی موثر بر تصمیمگیری نمایندگان و راهکارهای مقابله با آن میپردازد. یکی از راهکارهای مطرح شده در این گزارش، شواهدمحور شدن راهحلها و شفافیت آنها برای عموم مردم است. طبق گزارش، این توصیه سبب استفاده از شواهد در جهت خطمشیگذاری بهتر و کاهش سوگیری تأیید، میشود. همچنین برای رفع سوگیری خوشبینی، توصیه به طراحی آزمایش و انجام تغییرات در اجرای خطمشی شدهاست. منظور از این توصیه آن است که باید آزمایشهایی سریع و مستمر طراحی شود تا بازخورد اولیهای در مورد واقعی بودن برنامهها به نمایندگان ارائه دهد. برخی دیگر از توصیهها نیز مرتبط با شواهدمحور بودن راهحلها و بررسی اثرات و پیامدهای خطمشی در اندازه کوچک پیش از اجرای آن در سطح کلان است [۲1]. در گزارش دیگر با عنوان «خطمشیگذاری هوشمند، رویکردی نوین برای کارآمدسازی نظام تصمیمگیری و قانونگذاری کشور»، شش گام برای قانونگذاری هوشمند بیان میشود که عبارتند از: شناسایی مسائل سیاستی، تشخیص دادن، طراحی، پیادهسازی، آزمون و پالایش. این مراحل با مراحل انجام RCT مطرح شده در قبل همپوشانیهایی دارد. مشخصاً گامهای چهارم و پنجم آن به آزمایش و سنجش و ارزیابی در خطمشیگذاری اشاره میکند. در گام چهارم یعنی پیادهسازی، راهکارهای ارائه شده، بهصورت آزمایشی اجرا میشود تا پیچیدگیهای موجود را تعدیل کرده و امکانپذیری طرح را قبل از اجرا در مقیاس کلان ارزیابی کنند. در گام پنجم یعنی آزمون، خطمشیها و طرحهای پیشنهادی بهصورت میدانی آزموده شده و با استفاده از ابزارهای سنجش اثر، ارزیابی میشوند و در پایان با استفاده از اطلاعات بهدستآمده بهترین راهکار بهبود برنامه و خطمشی مورد بررسی قرار میگیرد. ارزیابی هوشمند به این نکته تأکید دارد که فقط، یافتههای ارزیابی نیستند که میتوانند تأثیرگذار باشند؛ بلکه تصمیم برای ارزیابی، انتخاب روش و اینکه چگونه نتایج منتشر شوند میتواند اثرات بسیاری داشته باشد. تصمیم دربارهی هر یک از این موارد میتواند بر ارزیابی نهایی خطمشی اثرگذار باشد [19]. این گزارش چند پیشنهاد و توصیه کاربردی براساس یافتههای ناظر به هوشمندسازی خطمشی ارائه میکند که هر یک از آنها تا حدودی با حوزه قانونگذاری شواهدمحور مرتبط است. مرتبطترین آنها شامل این توصیهها میشود: طراحی فرایند ارزیابی و پیشارزیابی حین تدوین خطمشیها و قوانین؛ کاربست اجرای آزمایشی و اجرای محدود قوانین و خطمشیها پیش از اجرای آن در جامعه. مجموعا این گزارش ارتباط نسبتا نزدیکی با محتوای گزارش حاضر دارد و سعی در جا انداختن اهمیت قانونگذاری آزمایشی در فضای خطمشیگذاری و قانونگذاری دارد. دو گزارش مذکور به اهمیت آزمایش پیش از قانونگذاری و پیش از اجرای قانون در سطح کلان و برخی مزیتهای روش آزمایشی و مراحل آن اشاره میکنند و اما آنچه در در این بین در رابطه با اعمال روش آزمایشی مطرح نشده، داشتن «گروه کنترل و تخصیص تصادفی به دو گروه آزمایش و کنترل» است. اساسا این دو ویژگی باعث تفاوت روش RCT با سایر روشها و استاندارد طلایی بودن آن است و این ویژگیهاست که به اعتبار روش RCT میافزاید. تاکنون در گزارشهای مرکز پژوهش های مجلس شورای اسلامی به روش RCT و ویژگیهای آن پرداخته نشده و گزارش حاضر قصد تبیین این روش و پر کردن این خلا را داشت.
در ادامه مبتنی بر نکات و مطالب بحث شده در این گزارش، پیشنهادها و توصیههایی جهت ترویج و بکارگیری روش کارآزمایی تصادفی کنترل شده در فرایندهای مجلس شورای اسلامی ارائه میشود:
۱. بهترین راه برای ترویج و بکارگیری RCTها، شروع تلاش است. یادگیری از تجربه و کار بر روی RCTها منجر به توسعه بلندمدت قابلیت RCT میشود. هم RCTهای بهینه سازی و هم RCTهای سیاستی میتوانند برای حکمرانی بسیار ارزشمند باشند. RCTهای بهینه سازی معمولا به نسبت RCTهای سیاستی تاثیرگذاری کمتری دارند اما بسیار کم هزینهتر و قابل دوامتر هستند (برای نمونه به مورد ۴ بخش تجربیات جهانی مراجعه شود). RCTهای سیاستی از نظر اثربخشی دارای ظرفیت بیشتری هستند اما ریسک بیشتری دارند و پرهزینهتر هستند و عمدتا با موانع بیشتری رو به رو هستند. اما به طور کلی شروع تلاش برای اجرای RCTها موثر است. نتایج نظرسنجی از نمایندگان مجلس استرالیا نشان داد از میان آن دسته از نمایندگانی که در گذشته از نتایج RCT برای تصمیمگیریها استفاده کرده بودند، ۶۷ درصد RCTها را به عنوان یکی از سه ورودی اولویت دار در تصمیمگیریهای سیاستی خود برای آینده انتخاب کرده بودند و در مقابل تنها ۱۲ درصد از نمایندگانی که قبلا از RCT استفاده نکرده بودند، این روش را در آینده اولویت خود در تصمیم گیری میدانستند [6]. در واقع این مسئله قدرت آشنایی با RCTها را نشان میدهد. صرفا شروع به استفاده از RCTها میتواند به تقاضای بیشتر برای بکارگیری آنها در آینده کمک کند.
۲. توصیه دوم این است که نمایندگان مجلس پیش از تصمیمگیریها، شواهد و نتایج RCTهای مرتبط با قوانین، طرحها و لوایح را از مراکز پژوهشی مطالبه نمایند و تصمیمگیریهای خود و نیز تخصیص بودجه به قوانین و طرحها را مبتنی بر شواهد ارائه شده انجام دهند. همچنین نمایندگان میتوانند رویکرد «پرداخت برای موفقیت» را اتخاذ کنند [20] که طبق آن بودجه صرفا در طرحها و برنامههایی هزینه می شود که شواهدی از اثربخشی و دستیابی به اهداف معین، پیش از اجرای اصلی (طبق نتایج RCTها) ارائه میکنند .
۳. اهتمام جدی به بررسی اثربخشی قوانین و طرحها پیش از تصمیم گیری قطعی حول آنها نیاز است. برای این مورد پیشنهاد میشود درصدی از بودجه برنامهها و طرحها (طبق پیشنهادات جهانی ۱ درصد از بودجه کل طرح) به ارزیابی پیشینی و کارآمدی طرح تخصیص پیدا کند. طبق یک اصطلاح مطرح، حداقل ۱ سنت از هر دلار باید برای تعیین اینکه چه چیزی موثر است سرمایه گذاری شود تا ۹۹ سنت دیگر به طور موثر و کارآمدتر هزینه شود [20].
۴- از آنجایی که طراحی و اجرای RCTهای مناسب، کاری تخصصی است و به صورت متمرکز باید انجام گیرد، پیشنهاد میشود کارگروهی تخصصی و با کارکرد طراحی و اجرای RCTهای مرتبط با قوانین، لوایح و طرحهای مجلس ایجاد شود (ذیل مرکز پژوهشهای مجلس و در یکی از دفاتر آن) و یا در غیر این صورت مرکزی با این تخصص برای این هدف به استخدام مرکز پژوهشهای مجلس شورای اسلامی درآید. این مرکز به صورت متمرکز به تامین نیازهای روز مجلس شورای اسلامی و ارائه نتایج RCTها میپردازد و این نتایج را به نمایندگان ارائه مینمایند و موظف است دقیقترین راهبردهای ممکن را برای بهبود برنامهها و طرحها ارائه دهد. هچنین منابع تخصصی و علمی، فنی و انسانی مورد نیاز را متمرکز میکند و بار برون سپاری پراکنده را کاهش میدهد و از ظرفیت متخصصین و جامعه دانشگاهی نیز استفاده مینمایند. نهایتا قانون گذاری شواهد محور و روش کارآزمایی تصادفی کنترل شده را ترویج میکند و بر فرآیند آن نظارت انجام میدهد.
۵- ترویج و گسترش اجرای روش RCT نیازمند حمایت مسئولین و افزایش انعطاف پذیری نهادهای بالادستی میباشد. طراحی و اجرای RCTهای مطلوب توسط متخصصین نیازمند حمایت و همراهی مسئولین در دادن دسترسیها، مجوزها و اختیارات مورد نیاز به متخصصین دستاندرکار میباشد تا بتوانند استراتژیهای مبتکرانه بکار برند و RCTهای مورد نیاز را طراحی و پیاده سازی کنند و نتایج را ارزیابی و ارائه نمایند. برای نمونه در آمریکا حمایت رئیس جمهور اوباما در صدور دستورالعمل التزام دولت بر استفاده از شواهد و در انگلستان دسترسی و مجوز دفتر نخست وزیر برای ایجاد مرکز BIT بر گسترش استفاده از روش RCT و دستیابی به ارزش افزودههای آن برای حکمرانی بسیار موثر بود [20].
۶- نهایتا آخرین توصیه حمایت از اشتراک گذاری و استفاده مناسب از دادهها و شواهد است. نتایج کارآزماییهای تصادفی کنترل شده باید در قالبی کاربرپسند منتشر و ترویج شود. در واقع مطلوب است تا بخشهای مختلف مجلس و سایر نهادهای حکمرانی و مسئولین به نتایج شواهد دسترسی داشته باشند و این نتایج با بخشهای مختلف به اشتراک گذاشته شود تا مورد استفاده قرار گیرد (البته با رعایت ملاحظات محرمانگی). عدم شفافیت ارزیابیها، اعتبار همه ارزیابیها و تصمیمات مبتنی بر شواهد را کاهش میدهد ضمن اینکه با این اشتراک گذاری سایر نهادهایی که به این نتایج نیاز داشتند دسترسی پیدا میکنند و پیوند دادهها بین نهادها رخ میدهد و از این پیوند و شبکه دادهها میتوان در جهت بهبود نتایج بهره برد.