از رگرسیون برای به دست آوردن رابطه میان یک یا چند متغیر مستقل و یک متغیر وابسته استفاده می کنیم. اگر

ضریب تعین چیست؟ و چرا معیاری برای بررسی مناسب بودن رگرسیون می باشد؟

از هیچ کدام از متغیر های مستقل (X ها) در به دست آوردن رابطه استفاده نکنیم بنابراین برازش ما یا خط پیشنهادی ما می باشد و در نتیجه میزان انحرافات (خطاها) از رابطه ی به دست می آید که آن را مجموع توان دوم کل می نامیم.
اگر از آگاهیمان نسبت به متغیر های مستقل (X ها ) استفاده کنیم

خطی که برازش می دهیم می باشد و بنابراین انحرافات از رابطه ی به دست می آید که آن را مجموع توان دوم خطا می نامیم.
اگر تمام شاهدات ( Y ها) بر روی خط رگرسیونی برازش شده () باشد در نتیجه و مجموع توان دوم آن ها نیز برابر صفر می شود.

با توجه به اینکه
SST: مجموع توان دوم خطاها زمانی است که از متغیر های مستقل (X ها ) استفاده نمی کنیم.
SSE: مجموع توان دوم خطاها زمانی است که از متغیر های مستقل (X ها ) استفاده می کنیم.

SSR = SST – SSE

کاهش در مجموع توان دوم خطا ها به خاطر استفاده از متغیر های مستقل (x ها) می باشد (هر چه بزرگتر باشد بهتر است) بنابراین SSR را مجموع توان دوم رگرسیون می نامیم.
اگر SSR = 0 باشد رابطه ی رگرسیونی اصلا کاربرد نداشته است.

ضریب تعین چیست؟

می دانیم SSR کاهش تغیر پذیری (خطا) به خاطر استفاده از متغیرهای مستقل است نسبت این کاهش را با R² نشان داده و ضریب تعیین می نامیم.

بنابراین مقادیری که R² می تواند اختیار کند بین صفر و یک می باشد اگر

R² = 1 باشد آن گاه SSR=SST یا به عبارتی SSE = 0 یعنی زمانی که از متغیرهای مستقل استفاده می کنیم هیچ خطای وجود ندارد که این بهترین حالت ممکن است.
R² = 0 باشد آن گاه SSR=0 یا به عبارتی SSE = SSR یعنی استفاده از متغیر های مستقل هیچ تاثیری بر برآورد خط رگرسیونی ندارد و .
ضریب تشخیص (به انگلیسی: Coefficient of Determination) که با علامت R2 نشان داده می‌شود، بیانگر میزان احتمال هم‌بستگی میان دو دسته داده در آینده می‌باشد.این ضریب درواقع نتایج تقریبی پارامتر موردنظر در آینده را براساس مدل ریاضی تعریف شده که منطبق بر داده‌های موجود است، بیان می‌دارد.

[thrive_leads id='1265']

ضریب تعین چیست؟

دسترسی سریع

تماس با تجارت نوین