چارک، دهک و صدک ها در آمار

در محاسبه شاخص های گرایش به مرکز، از آنجایی که میانه تحت تأثیر مقادیر شدید یا پرت در توزیع قرار نمی گیرد، گاهی اوقات به میانگین ترجیح داده می شود.  میانه یک تخمین‌گر قوی برای مکان است، اما در مورد نحوه پخش یا پراکندگی داده‌ها در دو طرف ارزش آن چیزی نمی‌گوید. این همان جایی است که چارک وارد می شود. چارک با تقسیم توزیع به چهار گروه، گسترش مقادیر بالاتر و پایین تر از میانگین را اندازه گیری می کند.

چارک(Quartile)

چارک اصطلاحی آماری است و شامل سه نقطه است که مجموعه ای از داده ها را به چهار قسمت تقسیم می کنند. بنابراین، سه چارک، با نام های چارک اول، چارک دوم وچارک سوم وجود دارد که به ترتیب با Q1 ، Q2  و Q3 نشان داده می شوند.

برای یافتن چارک ها، داده ها باید به ترتیب از کم به زیاد مرتب شوند. Q1  که چارک اول یا چارک پایین است داده ای است که 25 درصد مشاهدات از آن کوچکتر است. Q2  یا چارک دوم، چیزی جز میانه نیست. میانه نقطه ای که داده ها را به دو قسمت تقسیم می کند به طوری که 50 درصد مشاهدات از آن کوچکتر و 50 درصد بزرگتر باشند.  Q3نیز چارک سوم یا بالایی است. 25 درصد مشاهدات از آن بزرگتر و 75 درصد از آن کوچکتر هستند.

میانه، که چارک میانی است، نقطه مرکزی و چارک های بالا و پایین میزان گستردگی را مشخص می کنند.

فرمول  و روش محاسبه چارک ها

اگر تعداد  n مشاهده را به ترتیب صعودی مرتب کنیم:

چارک اول Q1: برابر است با [4/(n+1)] امین مشاهده

چارک دوم Q2: برابر است با [2/(n+1)]امین مشاهده

چارک سوم Q3: برابر است با [4/(n+1)3]امین مشاهده

فرض کنید نمرات درس آمار در یک کلاس با 19 دانشجو به ترتیب صعودی به صورت زیر است:

58، 60، 65، 65، 68، 69، 70، 72، 75، 75، 76، 77، 81، 82، 84، 87، 90، 95، 98

چارک اول 5 امین مشاهده، چارک دوم یا میانه 10 امین مشاهده و چارک سوم 15 امین مشاهده است. پس Q1=68 ، Q2=75 و Q3=84

این اعداد به ما می گویند:

25 درصد مشاهدات از 68 کوچکتر هستند و 75 درصد از آن بزرگتر.

50 درصد مشاهدات از 75 کمتر و 50 درصد از آن بزرگترهستند.

75 درصد مشاهدات از 84 کمتر و 25 درصد آن ها از آن بزرگتر هستند.

اگر تعداد نقاط داده زوج باشند، میانه، میانگین حسابی دو عدد میانی خواهد بود. در مثال بالا، اگر به جای 19، 20 دانشجو داشتیم، میانه نمرات آنها میانگین حسابی اعداد 10 و 11 خواهد بود.

در داده های دسته بندی شده  برای N مشاهده، چارک ها با فرمول زیر به دست می آیند:

دسته ها باید از کوچک به بزرگ مرتب شوند. بر اساس تعداد داده ها و فرمول های بالا باید مشخص شود که هر چارک چندمین مشاهده است. سپس فراونی تجمعی را محاسبه کرده و بر اساس آن مشخص کرد که هر کدام از چارک ها در کدام دسته از داده ها قرار می گیرد و چارک را با استفاده از فرمول زیر به دست آورد.

فرمول میانه

Qr : چارک r ام ، l1  : حد پایینی دسته ای که میانه قرار دارد ، l2  : حد بالایی دسته ای که میانه قرار دارد، f : فراوانی دسته،  و c : فراوانی تجمعی دسته قبل از دسته ای است که چارک قرار دارد.

برای مجموعه داده های بزرگ، مایکروسافت اکسل یک تابع QUARTILE برای محاسبه چارک ها دارد.

دامنه میان چارکی:

چارک ها برای محاسبه دامنه میان چارکی استفاده می شوند که معیاری برای تغییرپذیری حول میانه است. دامنه میان چارکی طول فاصله ای که نیمه مرکزی مشاهدات را دربر دارد، به دست می دهد. وجود مشاهدات خیلی بزرگ یا خیلی کوچک در این معیار اثری ندارد.

چارک اول- چارک سوم=دامنه میان چارکی

به غیر از چارک ها معیارهای دیگری (چندک ها) در آمار وجود دارد که مجموعه داده ها را به قسمت های مختلف تقسیم می کنند. از جمله آن ها می توان دهک ها و صدک ها را نام برد.

دهک(ِDecile):

دهک شکلی از چندک است که مجموعه داده ها را برای تجزیه و تحلیل بهتر تقسیم بندی می کند. دهک ها نقاطی در مجموعه داده ها هستند که وقتی مشاهدات از کوچک به بزرگ مرتب شوند، آن ها را به ده قسمت تقسیم می کنند. در واقع دهک ها از 9 نقطه تشکیل می شوند. دهک اول یا D1 نقطه‌ای است که 10 درصد از مشاهدات زیر آن، D2   نقطه ای است که 20 درصد مشاهدات زیر آن، … و در نهایت D9 نقطه ای است که 90 درصد مشاهدات زیر آن قرار دارند.

روش محاسبه دهک ها: یکی از روش های ساده محاسبه دهک ها به روش زیر است:

​ D1: برابر است با [10/(n+1)] امین مشاهده

D2: برابر است با [10/(n+1)2]امین مشاهده

D3: برابر است با [10/(n+1)3]امین مشاهده

D9: برابر است با [10/(n+1)9]امین مشاهده

واضح است که دهک پنجم همان میانه است.

محاسبه دهک ها در حوزه های مالی و امور اقتصادی بسیار پرکاربرد است.

 

صدک(Percentile):

 صدک ها نیز مانند دهک ها شکلی از چندک ها هستند. صدک ها داده ها را به صد قسمت تقسیم می کنند. صدک pام  مجموعه داده ها، مقادیری هستند که وقتی داده ها از کوچکترین تا بزرگترین مقدار مرتب شوند، حداقل p درصد از مشاهدات از آن کوچکتر و 1-p درصد از آن بزرگتر هستند. مثلاً صدک 15 مقداری است که 15 درصد داده ها از  آن کوچکتر و 85 درصد داده ها از آن بزرگتر هستند.

بنابراین چارک ها صدک های 25ام، 50ام و 75ام هستند.

دهک اول و صدک دهم، دهک دوم و صدک بیستم، ….، دهک نهم و صدک نودم یکسان هستند.

تابع “PERCENTILE “در اکسل صدک ها را برای مجموعه ای از داده ها محاسبه می کند.

3 دیدگاه. ارسال دیدگاه جدید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این فیلد را پر کنید
این فیلد را پر کنید
لطفاً یک نشانی ایمیل معتبر بنویسید.

فهرست