關於可決系數R-Square

未知大陆 2024-06-29 04:48 13次浏览 0 条评论 taohigo.com

首先定義一些概念:

樣本數據集: (x_1,y_1),(x_2,y_2),dots,(x_n,y_n)

經模型計算得到的預測值: hat{y_1},hat{y_2},dots,hat{y_n}

  • 觀測數據均值: bar{y}=frac{1}{n}sumlimits_{i=1}^ny_i
  • 殘差(residual)(與方差成比例): e_i=y_i-hat{y_i}
  • 總平方和(total sum of squares): SS_{tot}=sum_{i}(y_i-bar{y})^2
  • 回歸平方和,又稱可解釋平方和(regression/explained sum of squares): SS_{reg}=sum_{i}(hat{y_i}-bar{y})^2
  • 殘差平方和(residual sum of squares): SS_{res}=sum_{i}(y_i-hat{y_i})^2=sum_{i}e_i^2

知曉以上概念後,可決系數(coefficient of determination)的定義如下:

R^2=1-frac{SS_{res}}{SS_{tot}}

R^2為回歸平方和與總平方和的比值,反映瞭自變量對因變量的可解釋比例。

例如 R^2=0.8 ,表示自變量能夠解釋80%關於因變量的變化。