تجزیه به مؤلفه های اصلی

مجموعه داده های بزرگ به طور فزاینده ای در بسیاری از رشته ها گسترش می یابد و اغلب تفسیر آنها دشوار است. برای تفسیر چنین مجموعه‌ داده هایی‌، روش‌هایی لازم است که ابعاد داده ها را به روشی قابل تفسیر به شدت کاهش دهند، به طوری که بیشتر اطلاعات موجود در داده‌ها حفظ شود. امروزه تکنیک های زیادی برای این منظور توسعه یافته است، اما تجزیه و تحلیل مؤلفه اصلی (PCA) یکی از قدیمی ترین و پرکاربردترین آنهاست. ایده آن ساده است، کاهش ابعاد یک مجموعه داده، در حالی که تا آنجایی که ممکن است «تغییرپذیری» (یعنی اطلاعات آماری) حفظ شود.

بنابراین تجزیه و تحلیل مؤلفه اصلی (PCA) تکنیکی برای کاهش ابعاد مجموعه داده ها و افزایش تفسیرپذیری آن ­هاست. در فرایند کار تجزیه به مؤلفه های اصلی تا حد امکان اطلاع کمتری از دست داده می­شود.

تحلیل مؤلفه های اصلی به عنوان اولین هدف، ترکیب خطی استاندارد شده()، متغیرهای اولیه را که دارای واریانس ماکسیمال است جستجو می کند.

تحلیل مؤلفه های اصلی به تبیین ساختار واریانس-کوواریانس به کمک چند ترکیب خطی از متغیرهای اصلی سر و کار دارد. هدف کلی آن عبارت است تعبیر و تفسیر آسان تر داده با استفاده ازکاهش حجم داده ها.

برای مثال اگر برای مطالعه تغییرپذیری یک سیستم تعداد p متغیر وجود داشته باشد با استفاده از تجزیه به مؤلفه های اصلی می توان این تغییرپذیری را در قالب تعداد کمتری مثلاً k مؤلفه بیان نمود. در این صورت میزان اطلاعی که در k مؤلفه موجود است تقریباً مانند میزان اطلاع در p متغیر اولیه است.

یک تحلیل مؤلفه اصلی اغلب روابطی را که پیشتر مورد شک و تردید نبود را آشکار می سازد و بدین وسیله تعبیرهایی را که به طور عادی نتیجه نمی شد را امکان پذیر می کند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این فیلد را پر کنید
این فیلد را پر کنید
لطفاً یک نشانی ایمیل معتبر بنویسید.

فهرست