决定系数

决定系数,或稱判定系数英語:,记为R 2),在统计学中用于度量應變數的变异中可由自变量解释部分所占的比例,以此来判断迴歸模型的解释力。[1][2][3]

决定系数示意图 线性回归(右侧)的效果比起平均值(左侧)越好,决定系数的值就越接近于1。 蓝色正方形表示线性回归的残差的平方, 红色正方形数据表示对于平均值的残差的平方。

对于简单线性回归而言,决定系数为样本相关系数的平方。[4]当加入其他回归自变量后,决定系数相应地变为多重相关系数的平方。

假设一数据集包括y1,...,ynn个观察值,相对应的模型预测值分别为f1,...,fn。定义残差ei = yifi,平均观察值为

于是可以得到总平方和

残差平方和

由此,决定系数可定义为

参考文献

  1. Steel, R. G. D.; Torrie, J. H. . McGraw Hill. 1960.
  2. Glantz, Stanton A.; Slinker, B. K. . McGraw-Hill. 1990. ISBN 0-07-023407-8.
  3. Draper, N. R.; Smith, H. . Wiley-Interscience. 1998. ISBN 0-471-17082-8.
  4. Devore, Jay L. 8th. Boston, MA: Cengage Learning. 2011: 508–510. ISBN 0-538-73352-7.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.