معیارهای گرایش مرکزی چیستند؟

اندازه یا معیارهای گرایش مرکزی خلاصه توصیفی یک مجموعه از داده هاست، که مرکز توزیع داده ها را نشان می دهند. روش های مختلفی برای اندازه گیری گرایش مرکزی مجموعه ای از داده ها وجود دارد.

سه معیار اصلی برای گرایش مرکزی عبارتند از: مد(نما)، میانه و میانگین. هر یک از این معیارها نشانه متفاوتی از مقدار مرکزی در توزیع را توصیف می کند.

مد(mode):

داده ای است که بیشترین تکرار را در مجموعه داده دارد. محاسبه مد برای داده های سطح اسمی اندازه گیری بیشترین کاربرد را دارد.

میانه(median):

عدد میانی در یک مجموعه داده مرتب شده است. وقتی داده ها از کم به زیاد مرتب می شود میانه دقیقاً در وسط قرار دارد. بسته به زوج یا فرد بودن تعداد کل مقادیر، از روش های مختلفی برای یافتن میانه یک مجموعه داده استفاده می شود.

میانگین(mean):

 ازمجموع همه مقادیر تقسیم بر تعداد کل مقادیر بدست می آید. در محاسبه میانگین تمام مقادیر داده ها دخیل هستند. میانگین متداول ترین معیار گرایش مرکزی است.

معیارهای گرایش مرکزی

چه زمانی باید از میانگین، میانه یا مد استفاده کنید؟

سه  معیار اصلی گرایش مرکزی بهتر است در ترکیب با یکدیگر استفاده شوند زیرا دارای نقاط قوت و محدودیت های مکمل هستند. اما گاهی اوقات بسته به سطح اندازه گیری متغیر فقط یک یا دو مورد از آنها برای مجموعه داده ها قابل استفاده است.

 مد را می توان برای هر سطح از اندازه گیری استفاده کرد، اما برای سطوح اسمی و ترتیبی بسیار معنی دار است.

میانه را فقط می توان روی داده هایی استفاده کرد که می توانند مرتب شوند، یعنی داده هایی از سطوح ترتیبی، فاصله ای و نسبتی هستند. میانه برای داده های اسمی بی معنا است.

میانگین فقط برای سطوح فاصله ای و نسبتی قابل استفاده است.

گذشته از سطح اندازه گیری داده ها، در داده های نسبتی و فاصله ای با توجه توزیع داده ها برخی از معیارها بر دیگری ترجیح داده می شود.

در مجموعه ای از داده ها که از توزیع نرمال تبعیت می کنند هر سه معیار مد، میانه و میانگین بر هم منطبق هستند. یعنی هر سه عدد یکسان است.

در مجموعه ای از داده ها که توزیع چاوله یا اریب دارند مقادیر بیشتری در یک سمت مرکز نسبت به سمت دیگر قرار می گیرند و میانگین، میانه و حالت همگی با یکدیگر متفاوت هستند. در این شرایط میانگین را باید با احتیاط به کار برد.

در برخی از مجموعه داده ها مشاهدات پرت بسیار بزرگ یا بسیار کوچک وجود دارند. این داده های پرت زمانی که در محاسبه لحاظ شوند می توانند میانگین را به میزان قابل توجهی افزایش یا کاهش دهند .از آنجایی که تمام مقادیر برای محاسبه میانگین استفاده می شود، می تواند تحت تأثیر مقادیر پرت شدید قرار گیرد. اما میانه بعد از مرتب کردن داده ها تنها با یک یا دو مقدار میانی مرتبط است. میانگین پیراسته و میانگین وینزوری با تلفیقی از میانگین و میانه داده ها محاسبه می شوند.

میانگین پیراسته

در این میانگین ابتدا مشاهدات کوچکتر از چارک اول و بزرگتر از چارک سوم کنار گذاشته می شوند سپس میانگین داده های باقیمانده محاسبه می شود.

 میانگین وینزوری

در این میانگین به جای هر یک از مشاهدات کوچکتر از چارک اول، مقدار چارک اول و به جای هر یک از مشاهدات بزرگتر از چارک سوم، مقدار چارک سوم قرار می گیرد، سپس با استفاده از این داده ها میانگین محاسبه می شود.

بنابراین در محاسبه میانگین پیراسته و میانگین وینزوری مشاهدات پرت تاثیری نخواهد داشت.

در صورتی که توزیع داده ها متقارن باشد این دو میانگین تقریباً با میانگین داده ها یکی است. ولی در توزیع هایی که یکی از دنباله ها کشیده تر است این دو میانگین، جایگزین های مناسبی برای میانه و میانگین هستند.

به طور خلاصه در انتخاب معیار گرایش مرکزی، توجه به موارد زیر ضروری است:

1-هدف از توصیف و خلاصه سازی داده ها

2-تعبیر پذیری معیار برای نوع داده ها

3-درجه تأثیرپذیری از داده های پرت

4-کاربرد معیار در فرآیند استنباط آماری

 

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این فیلد را پر کنید
این فیلد را پر کنید
لطفاً یک نشانی ایمیل معتبر بنویسید.

فهرست