当预测变量是数值型变量时,我们通常会选择一些准确性的度量方法来评估模型的有效性,接下来我们总结了一些度量标准,并写出用R语言实现代码:
1、均方根误差(root mean squared error,RMSE)
2、均方误差(mean aquared error,MSE)
3 、R^2 =r^2 表示数据中包含的信息中能被模型解释的比例
R^2是一种相关性度量,而不是准确性度量标准
4、Spearman 秩相关系数
建模的目的是对新样本进行排序时,可用Spearman 秩相关系数 定量度量模型的效果
Spearman 秩相关系数的计算方法:首先计算观测值的秩,然后衡量它与预测值的秩的相关系数。
5、方差-偏差的均衡
假设数据点是统计独立的,那么残差具有理论上的零均值和常数方差σ,那么
偏差,反映的是模型的函数形式与预测变量、结果变量之间真实关系的接近程度。
一般而言,复查的模型通常会有很高的方差,这会导致过度拟合;另一方面,简单的模型如果没有足够的灵活性来刻画真实的变量关系,那么通常会拟合不足,从而产生较高的偏差。这就是所谓的方差-偏差均衡。
6、计算
> oberved<-c(0.22,0.83,-0.12,0.89,