تجزیه و تحلیل باقیماندها در رگرسیون خطی

رگرسیون خطی تکنیکی آماری است که به وسیله آن تحلیلگر به معادله خط مستقیمی دسترسی پیدا می کند که به بهترین وجه ارتباط خطی بین متغیر وابسته و متغیر(های) مستقل را بیان می کند. این معادله به روش حداقل مربعات به دست می آید.

ازمهترین کاربردهای معادله رگرسیونی، تخمین مقدار یک متغیر وابسته برای یک مقدار معین از یک متغیر مستقل است.

اگر چه مدل برازش شده رگرسیونی بهینه ترین مدل برای توصیف رابطه خطی متغیرهاست، امّا نقاط داده معمولاً دقیقاً روی این خط معادله رگرسیون قرار نمی گیرند و در اطراف خط برازش شده پراکنده هستند .

باقیمانده فاصله عمودی بین یک نقطه داده مشاهده شده و خط رگرسیون برازش شده است.به عبارت ساده، باقیمانده خطای بین یک مقدار پیش بینی شده و مقدار واقعی مشاهده شده است. هر نقطه داده یک باقیمانده دارد.

بنابراین باقیمانده ها از تفریق مقادیر مشاهده شده و پیش بینی شده به دست می آیند.

فرمول برای باقیمانده ها

اگر متغیر وابسته را y بنامیم آنگاه باقیمانده برابر است با

باقیمانده = y مشاهده شده – y پیش بینی شده y

توجه به این نکته مهم است که مقدار پیش بینی شده از خط رگرسیون . ومقدار مشاهده شده از مجموعه داده ها می آید.

مثال: فرض کنید مشاهدات ما برای متغیر وابسته y و متغیر مستقل x به شکل زیر است. و با استفاده از نرم افزار خط رگرسیونی حداقل مربعات  y = 2x است.

باقیمانده Y (پیش بینی) Y (مشاهده شده) x
0 2 2 1
1- 4 3 2
1 6 7 3
0 6 6 3
1 8 9 4
1- 10 9 5

 

برای محاسبه y پیش بینی شده مقدار x را در معادله رگرسیون قرار داده و مقدارY  پیش بینی به دست می آید.

مثلاً برای x=4 داریم 4*2=8 مقدار y پیش بینی شده برابر 8 است در حالی که مقدار مشاهده آن برابر 9 است. اختلاف این دو یعنی 1 باقیمانده را نشان می دهد.

نکات مهم:

  • لازم است توجه شود که باقیمانده ها برای نقاطی که بالای خط رگرسیون قرار می گیرند مثبت و برای نقاطی که زیر خط رگرسیون قرار می گیرند منفی هستند. اگر خط رگرسیون دقیقاً از نقطه عبور کند باقیمانده صفر می شود.

هر چه قدرمطلق باقیمانده بیشتر باشد، نقطه از خط رگرسیون دورتر است.

  • مجموع همه باقیمانده ها همیشه صفر خواهد بود.

موارد کاربرد باقیمانده ها در تحلیل رگرسیون

با تجزیه و تحلیل باقیمانده ها می توان برازش مدل رگرسیونی را اعتبار سنجی کرد. باقیمانده های یک مدل رگرسیونی معتبر باید ویژگی ها زیر را داشته باشند:

1-توزیع آنها تقریباً نرمال باشد.

یکی از مفروضات تحلیل رگرسیون این است که توزیع باقیمانده های مربوط به خط رگرسیونی، نرمال باشد. رسم یک هیستوگرام از باقیمانده ها به قضاوت در مورد اینکه آیا این شرایط برآورده شده است یا نه، کمک می کند.

همچنین استفاده از نمودارهای Q-Q نیز می تواند کمک خوبی در تشخیص این موضوع باشد. در این نمودار اگر داده ها از یک جامعه نرمال باشند نقاط کم و بیش روی یک خط مستقیم قرار می گیرند.

با استفاده از قابلیت های نرم افزارهای آماری از جمله spss می توان این روش ها را به سادگی مورد استفاده قرار داد.

2-واریانس آنها برای تمام مقادیر مستقل ثابت باشد.

برای بررسی اینکه آیا واریانس متغیر وابسته برای تمام مقادیر متغیر مستقل ثابت است می توان از نمودار کردن باقیمانده های استاندارد شده در مقابل مقادیر پیش بینی شده استفاده کرد. اگر الگویی در نقاط مربوط به داده ها در این نمودار مشاهده نشود نتیجه گیری می شود که واریانس ثابت است و باقیمانده ها به صورت تصادفی اطراف خط افقی پراکنده اند.

اگر واریانس متغیر وابسته ثابت به نظر نرسد می توان مقادیر متغیر وابسته را تبدیل کرد و با استفاده از داده های جدید مدل را برازش داد.

3-هنگامی که باقیمانده ها را در مقابل مقادیر پیش بینی شده نمودار می کنیم نباید از الگوی خاصی پیروی کند و باید تصادفی باشند.

فرض خطی بودن رابطه متغیر مستقل و وابسته را می توان با رسم نمودار باقیمانده های استاندارد شده در مقابل مقادیر پیش بینی شده، بررسی کرد. اگر رابطه بین متغیر مستقل و وابسته خطی نباشد در این نمودار یک منحنی مشاهده می شود.

4-مشاهدات باید مستقل از یکدیگر باشد.

یکی از مفروضات لازم برای برازش خط رگرسیونی، مستقل بودن مشاهدات است. به این معنی که مقدار یک مشاهده با مشاهدات دیگر به هیچ طریقی رابطه نداشته باشد. هنگامی داده ها به صورت متوالی جمع آوری می شوند مستقل بودن می تواند مورد خدشه واقع شود.

فرض مستقل بودن را می توان با نمودار کردن باقیمانده های استاندارد در مقابل متغیر توالی (ترتیب مشاهدات) استفاده کرد.

برای بررسی رابطه بین مشاهدات نزدیک به هم می توان از آزمون دوربین-واتسون نیز استفاده کرد.

برای بررسی مفروضات بالا می توان نرم افزارهای آماری را به کار گرفت و نتایج حاصل را تفسیر کرد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این فیلد را پر کنید
این فیلد را پر کنید
لطفاً یک نشانی ایمیل معتبر بنویسید.

فهرست