داده پرت چیست؟
در ادامه آموزش های متلب با مفهوم داده های پرت در داده کاوی در کنار شما خواهیم بود این آموزش از صفر تا صد نحوه برنامه نویسی در این محیط را را فرا خواهید گرفت این آموزش به صورت فیلم آموزشی کامل تهیه شده است و در کمترین زمان ممکن قادر به یادگیری در این حوزه خواهد بود.
داده پرت چیست؟
داده های پرت (outliers) داده هایی هستند که در فاصله غیر نرمالی از سایر مقادیر هم گروه خود قرار دارد و فاصله زیادی از آنها دارند.
انواع روش های مواجهه با داده های پرت
در هنگام شناسایی داده های پرت باید به سوال پاسخ بدهیم:
چه تعداد ویژگی یا متغیر در شناسایی داده های پرت به کار گرفته می شود؟ تک متغیره یا چند متغیره. در روش تک متغیره، در هر زمان یک متغیر برای شناسایی داده های پرت مورد بررسی قرار می گیرد اما در روش چند متغیره، در هر زمان چند متغیر مورد بررسی قرار می گیرد.
برخی از پرکاربردترین روش های شناسایی داده های پرت عبارتند از:
تحلیل مقدار حداکثری یا z-score (پارامتریک)
مدلسازی آماری و احتمالاتی (پارامتریک)
مدل های رگرسیون خطی (PCA, LMS)
مدل های مبتنی بر مجاورتی (غیرپارامتریک)
مدل های تئوری اطلاعات
روش های شناسایی خطای با ابعاد بالا
در اینجا آموزش مفهوم داده های پرت در علم داده کاوی و انواع روش های شناسایی و پیدا کردن آنها بررسی شد با سایر آموزش های گروه متلب پروژه در ارتباط باشید.