نمونه‌گیری‌های غرض‌ورزانه و خطاهای نمونه‌گیری

در روزگار ما که داده‌ها، نمودارها و درصدها هر لحظه در رسانه‌ها، شبکه‌های اجتماعی و حتی گفتگوهای روزمره حضور دارند، درک درست از مفاهیم آماری اهمیت فراوانی دارد. یکی از خطاهای رایج که به‌شدت می‌تواند برداشت ما را از واقعیت منحرف کند، خطای نمونه‌گیری و استفاده از نمونه‌های غرض‌ورزانه است.

تصور کنید در آستانۀ انتخابات، یکی از کانال‌های وابسته به جریان خاصی از احزاب سیاسی، نظرسنجی‌ای منتشر می‌کند و در آن اعلام می‌شود که “79 درصد از پاسخ‌دهندگان گفته‌اند به نامزد حزب ما رأی خواهند داد.” این آمار ممکن است برای هواداران حزب امیدوارکننده و برای رقبا نگران‌کننده باشد. اما آیا می‌توان با استناد به این عدد نتیجه گرفت که در سطح کل جامعه نیز چنین حمایتی وجود دارد؟ پاسخ این سؤال منفی است، مگر آنکه مطمئن باشیم نمونه‌ای که نظرسنجی از آن انجام شده است، نمایندۀ واقعی کل جامعه باشد.

واقعیت این است که در بسیاری از این نظرسنجی‌ها، نمونه‌گیری از مخاطبان خود کانال یا گروه‌های همفکر انجام می‌شود. حال آنکه ترکیب اعضای یک کانال حزبی، عموماً شامل افرادی است که یا هوادار آن حزب هستند یا حداقل به آن دیدگاه تمایل دارند. در چنین وضعیتی، احتمال دارد بیش از 90 درصد اعضا، پیشاپیش موافق دیدگاه‌های مطرح‌شده در کانال باشند. بنابراین طبیعی است که چنین نظرسنجی‌ای به نفع حزب برگزارکننده نتیجه بدهد، اما این به‌هیچ‌وجه به‌معنای تعمیم‌پذیری به کل جامعه نیست. این نمونه‌گیری، مصداق بارز «نمونه‌گیری غرض‌ورزانه» است؛ یعنی انتخاب گروهی خاص از جامعه که نتیجه‌ای مطابق انتظار را نشان دهد.

این خطا تنها مختص نظرسنجی‌های سیاسی نیست. در حوزه‌های دیگر هم چنین اشتباهاتی شایع است. فرض کنید خبرنگاری برای گزارش‌گیری دربارۀ مالیات بر خانه‌های خالی، به محله‌ای می‌رود که عمدتاً قشر ثروتمند و مالکان بزرگ ساکن هستند. طبیعی است که در چنین محیطی، بسیاری با مالیات بر املاک موافق نباشند، چون منافع‌شان به خطر می‌افتد. حال اگر خبرنگار نتایج این مصاحبه‌ها را به‌عنوان نظر کلی جامعه منتشر کند، تصویر نادرستی از افکار عمومی ارائه داده است. در اینجا نه محتوای پاسخ‌ها بلکه شیوۀ انتخاب افراد پاسخگو، محل اشکال است.

از همین جنس است مثال معروفی از روان‌پزشکی که ادعا می‌کند “همۀ مردم دیوانه‌اند” و دلیلش این است که او روزانه با بیمارانی مواجه می‌شود که از اختلالات روانی رنج می‌برند. اما واقعیت این است که «نمونۀ در دسترس» او، یعنی بیمارانی که به مطب مراجعه می‌کنند، نمایندۀ تمام جامعه نیستند. اگر او به میان مردم عادی برود، شاید نظرش کاملاً تغییر کند. این نمونه یکی از شایع‌ترین انواع خطا در تحقیقات اجتماعی است: «تعمیم مشاهدات محدود به کلیت جامعه.»

نمونه‌گیری علمی و معتبر، بر پایۀ انتخاب تصادفی است؛ یعنی هر فرد از جامعه آماری باید شانس یکسانی برای انتخاب‌شدن داشته باشد. تنها در چنین شرایطی است که می‌توانیم با تقریب مناسبی نتایج به‌دست‌آمده را به کل جامعه تعمیم دهیم. اما انجام این نوع نمونه‌گیری دشوار، پرهزینه و زمان‌بر است. به همین دلیل، بسیاری از روزنامه‌نگاران، پژوهشگران آماتور، و فعالان مجازی ترجیح می‌دهند به سراغ نمونه‌های در دسترس بروند و بر اساس آن، گزاره‌هایی کلی و گاه نادرست بسازند.

مشکل زمانی حادتر می‌شود که نتایج این نوع نمونه‌گیری‌ها، در قالب گزارش‌های رسمی یا تحلیل‌های رسانه‌ای منتشر شود و بر تصمیم‌گیری‌های فردی یا اجتماعی تأثیر بگذارد. گاهی یک آمار نادرست می‌تواند به باور غلطی دامن بزند، سیاستی نادرست را مشروع جلوه دهد، یا تصویری واژگونه از واقعیت بسازد.

در پایان، آنچه اهمیت دارد، تقویت سواد آماری در جامعه است. ما باید یاد بگیریم که نسبت به هر عدد و آماری با دقت و شک‌ورزی علمی نگاه کنیم. مهم نیست چند درصد گفته‌اند یا چه نموداری منتشر شده؛ مهم این است که سؤال کنیم: «این عدد از کجا آمده؟»، «چه کسانی در این نظرسنجی شرکت کرده‌اند؟»، «چه کسی آن را طراحی کرده؟» و «آیا این نمونه واقعاً نمایندۀ جامعه است یا فقط صدای بلند گروهی خاص؟»