معنی داری آماری، مقدار احتمال(p-value) و سطح اطمینان

معنی داری آماری(Statistical Significance)

هنگام مطالعه یا انجام تحقیقات، احتمالاً با اصطلاح “معنی داری آماری” روبرو شده اید. معنی‌داری آماری یک اصطلاح است که درک مفهوم آن برای رشته های دانشگاهی یا محققان و مشاغلی که به شدت بر تجزیه و تحلیل داده ها متکی هستند، مهم است. رشته هایی  از جمله اقتصاد، امور مالی، سرمایه گذاری، پزشکی، فیزیک ، زیست شناسی و ….

در تحقیق، معناداری آماری معیاری برای احتمال درستی فرضیه صفر در مقایسه با “سطح قابل قبولی از عدم قطعیت” در مورد پاسخ صحیح است. این سطح قابل قبول از عدم قطعیت را سطح معنی داری می گویند.

معنی‌داری آماری به این ادعا اشاره دارد که رفتار یا ویژگی مشاهده شده از مجموعه‌ داده‌های نمونه، نتیجه تصادف نیست، بلکه می‌تواند به علت خاصی نسبت داده شود.

معنی داری آماری میزان اطمینان از وجود تفاوت یا رابطه بین متغیرها را نشان می دهد. هنگامی که یک نتیجه از نظر آماری معنی دار است، این اطمینان ایجاد می شود که یک تفاوت یا رابطه واقعی بین متغیرها وجود دارد، و بعید است که یک اتفاق شانسی باشد.

محققان از اندازه‌ ای به نام مقدار احتمال(p-value) و مقایسه آن با سطح معنی داری(significance level) برای تعیین معنی داری آماری استفاده می‌کنند.

محقق قبل از انجام آزمایش سطح معنی داری را تعیین می کند. اما مقدار احتمال عددی است که توسط یک آزمون آماری با استفاده از داده های نمونه محاسبه می شود.

اگر p-value کمتر از سطح معنی‌داری باشد، نتیجه از نظر آماری معنادار است.

محاسبه معنی داری آماری

محاسبه معنی داری آماری در معرض درجه معینی از خطا است. حتی اگر به نظر می رسد که داده ها دارای یک رابطه قوی هستند، پژوهشگر باید این احتمال را که یک همبستگی ظاهری به دلیل شانس، تصادفی یا یک خطای نمونه گیری ایجاد شده است، در نظر بگیرد.

اندازه نمونه جزء مهمی از معنی داری آماری است، اندازه نمونه به میزان حجم نمونه مورد بررسی اشاره دارد. هرچه حجم نمونه بزرگتر باشد، می توان به نتیجه آزمایش اطمینان بیشتری داشت (با فرض اینکه نمونه تصادفی باشد).

نمونه‌های بزرگتر کمتر مستعد ابتلا به تصادف هستند. فقط نمونه‌های تصادفی انتخاب شده باید در آزمون معنی‌داری استفاده شوند. اگر حجم نمونه خیلی کم باشد با خطاهای نمونه گیری مواجه خواهید شد. معنی داری آماری در تحقیقات تمام شماری کاربرد و مفهوم ندارد.

معنی داری آماری تنها با حضور فرض های آماری مفهوم پیدا می کند.اساساً معنی داری آماری وقتی کاربرد دارد که فرضیه ای در مورد پارامتری از جامعه که توسط نمونه تخمین زده شده، مطرح باشد.

سطح معنی داری(significance level):

سطحی که در آن می توان پذیرفت که آیا یک رویداد از نظر آماری معنادار است یا خیر به عنوان سطح معنی داری شناخته می شود. سطح معنی داری را با α نیز نشان می دهند.

همانطور که قبلاً اشاره شد سطح معنی داری توسط محقق تعیین می شود.

سطح معناداری احتمال رد فرضیه صفر در صورت صحت است.  به عنوان مثال، سطح معنی داری 05/0 نشان دهنده خطای 5 درصدی نتیجه گیری است. یعنی 5 درصد احتمال دارد فرض صفر را در حالی رد کنیم که درست و برقرار باشد. مثلاً 5 درصد احتمال دارد تفاوت واقعی وجود داشته باشد در حالی که محقق وجود این تفاوت را رد کرده است. به بیان بسیار ساده تر محقق برای خود 5 درصد حق خطا قائل می شود.

مقدار احتمال(p-value)

مقدار احتمال، عددی است که توسط محقق محاسبه می شود. p-value یک احتمال است، عددی بین 0 و 1 که پس از اجرای یک آزمون آماری بر روی داده ها محاسبه می شود. مقدار احتمال را “سطح معنی داری مشاهده شده” نیز می گویند. چون بر اساس داده های مشاهده شده، محاسبه می شود.

p-value با استفاده از توزیع نمونه آماری آزمون، تحت فرضیه صفر، داده های نمونه و نوع آزمون در حال انجام (آزمون یک دامنه یا آزمون دو طرفه) محاسبه می شود.

p-value  تابعی از میانگین و انحراف معیار داده های نمونه است.

با وجود p-value به اندازه کافی کوچک، با خیال راحت تری می توان فرض صفر را رد کرد.

مثلاً اگر p-value کوچکتر از سطح معنی داری 0/05 باشد یعنی فقط 5 درصد احتمال دارد که فرض صفر را رد کنیم در حالی که صحت داشته باشد.

سطح اطمینان

نقطه مقابل سطح معنی داری، سطح اطمینان است. سطح اطمینان، به صورت 1 منهای سطح معنی داری محاسبه می شود. سطح اطمینان نشان دهنده درجه اطمینانی است  که نتیجه آماری تصادفی، یا با خطای نمونه گیری اتفاق نیفتاده است.

سطح اطمینان مرسوم در بسیاری از آزمون‌های آماری 95% است که منجر به سطح معنی‌داری معمول یا p-value برابر 5% می‌شود.

در بیشتر علوم، اگر یک نتیجه از سطح اطمینان 95٪ (یا گاهی اوقات 99٪) برخوردار باشد، از نظر آماری معنادار در نظر گرفته می شود.

**یک یافته از نظر آماری معنی دار، ممکن است در دنیایی واقعی درست یا نادرست باشد. نادرست  به این معنی که نتایج را نمی توان در موقعیت های دنیای واقعی اعمال کرد.

این واقعیت که یک نتیجه از نظر آماری معنی‌دار است به این معنی نیست که نتیجه تصادفی نیست، بلکه فقط احتمال کمتری وجود دارد که چنین باشد. اینکه دو سری داده با یکدیگر همبستگی قوی دارند، همیشه به معنای علیّت نیست!!! ادعای علّی حتما باید مبانی نظری داشته باشد.

داشتن درک کامل از معنی داری آماری و عوامل مؤثر در آن، برای انجام تحقیقات صحیح مهم است.

در صورت استفاده از نرم افزارهای آماری متداول مثل spss برای انجام آزمون فرضیات آماری، نرم افزار خود پارامترها را برآورد کرده و p-value را نیز محاسبه می کند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این فیلد را پر کنید
این فیلد را پر کنید
لطفاً یک نشانی ایمیل معتبر بنویسید.

فهرست