\(R^2\) 记录
\(R^2\) 用来表示线性拟合的程度,网上很多资料显示其计算方式如下:
\[
R^2 = \frac{\sum_{i=1}^n (\hat{y}_i - \bar{y})^2}{\sum_{i=1}^n (y_i - \bar{y})^2} = 1 - \frac{\sum_{i=1}^n (y_i - \hat{y_i})^2}{\sum_{i=1}^n (y_i - \bar{y})^2}
\]
其中,\(y_i\) 是真实值,\(\bar{y}\) 是所有真实值的平均值,\(\hat{y}_i\) 是预测值。
有些文章看起来很像回事,比如这篇文章,中山大学的团队写的。但实际上,上面两个等式是不成立的!!!一些文章还煞有介事地介绍了分子分母的意义,给出了公式为 \(R^2=SSR/SST=1-SSE/SST\),其实后面两个等式是不成立的。
最正确计算应该要按照后面的等式,即
\[
R^2 = 1 - \frac{\sum_{i=1}^n (y_i - \hat{y_i})^2}{\sum_{i=1}^n (y_i - \bar{y})^2}
\]