از رگرسیون برای به دست آوردن رابطه میان یک یا چند متغیر مستقل و یک متغیر وابسته استفاده می کنیم. اگر

- از هیچ کدام از متغیر های مستقل (X ها) در به دست آوردن رابطه استفاده نکنیم بنابراین برازش ما یا خط پیشنهادی ما
می باشد و در نتیجه میزان انحرافات (خطاها) از رابطه ی
به دست می آید که آن را مجموع توان دوم کل
می نامیم. - اگر از آگاهیمان نسبت به متغیر های مستقل (X ها ) استفاده کنیم

خطی که برازش می دهیم
می باشد و بنابراین انحرافات از رابطه ی
به دست می آید که آن را مجموع توان دوم خطا
می نامیم.
اگر تمام شاهدات ( Y ها) بر روی خط رگرسیونی برازش شده (
) باشد در نتیجه
و مجموع توان دوم آن ها نیز برابر صفر می شود.
با توجه به اینکه
SST: مجموع توان دوم خطاها زمانی است که از متغیر های مستقل (X ها ) استفاده نمی کنیم.
SSE: مجموع توان دوم خطاها زمانی است که از متغیر های مستقل (X ها ) استفاده می کنیم.
SSR = SST – SSE
کاهش در مجموع توان دوم خطا ها به خاطر استفاده از متغیر های مستقل (x ها) می باشد (هر چه بزرگتر باشد بهتر است) بنابراین SSR را مجموع توان دوم رگرسیون
می نامیم.
اگر SSR = 0 باشد رابطه ی رگرسیونی اصلا کاربرد نداشته است.

ضریب تعین چیست؟
می دانیم SSR کاهش تغیر پذیری (خطا) به خاطر استفاده از متغیرهای مستقل است نسبت این کاهش را با R2 نشان داده و ضریب تعیین می نامیم.![]()
بنابراین مقادیری که R2 می تواند اختیار کند بین صفر و یک می باشد اگر
- R2 = 1 باشد آن گاه SSR=SST یا به عبارتی SSE = 0 یعنی زمانی که از متغیرهای مستقل استفاده می کنیم هیچ خطای وجود ندارد که این بهترین حالت ممکن است.
- R2 = 0 باشد آن گاه SSR=0 یا به عبارتی SSE = SSR یعنی استفاده از متغیر های مستقل هیچ تاثیری بر برآورد خط رگرسیونی ندارد و
. - ضریب تشخیص (به انگلیسی: Coefficient of Determination) که با علامت R2 نشان داده میشود، بیانگر میزان احتمال همبستگی میان دو دسته داده در آینده میباشد.این ضریب درواقع نتایج تقریبی پارامتر موردنظر در آینده را براساس مدل ریاضی تعریف شده که منطبق بر دادههای موجود است، بیان میدارد.