با توجه به اینکه
SST: مجموع توان دوم خطاها زمانی که از متغیر های مستقل (X ها ) استفاده نمیکنیم.
SSE: مجموع توان دوم خطاها زمانی که از متغیر های مستقل (X ها ) استفاده میکنیم.
SSR = SST – SSE
SSR را مجموع توان دوم رگرسیون می نامیم و کاهش در مجموع توان دوم خطاها به خاطر استفاده از متغیر های مستقل (x ها) را نشان میدهد. هر چه SSR بزرگتر باشد بهتر است و اگر SSR = 0 باشد رابطه رگرسیونی اصلا کاربرد نداشته است.
می دانیم SSR کاهش تغییر پذیری (خطا) به خاطر استفاده از متغیرهای مستقل است. نسبت این کاهش را با R2 نشان داده و ضریب تعیین می نامیم.
R2 = SSR/SST
بنابراین مقادیری که R2 می تواند اختیار کند بین صفر و یک می باشد اگر
اگرR2 = 1 باشد آن گاه SSR=SST یا به عبارتی SSE = 0 یعنی زمانی که از متغیرهای مستقل استفاده می کنیم هیچ خطای وجود ندارد که این بهترین حالت ممکن است.
اگرR2 = 0 باشد آن گاه SSR=0 یا به عبارتی SSE = SSR یعنی استفاده از متغیر های مستقل هیچ تاثیری بر برآورد خط رگرسیونی ندارد.
R-square, also known as the coefficient of determination, is a commonly used statistic to evaluate the model fit of a regression equation. That is, how good are all of your independent variables at predicting your dependent variable? The value of R-square ranges from 0.0 to 1.0 and can be multiplied by 100 to obtain a percentage of variance explained. For example, going back to our GPA regression equation with only one independent variable (IQ)…Let’s say that our R-square for the equation was 0.4. We could interpret this to mean that 40% of the variance in GPA is explained by IQ. If we then add our other two variables (motivation and self-discipline) and the R-square increases to 0.6, this means that IQ, motivation, and self-discipline together explain 60% of the variance in GPA scores.