在前期做近红外定量分析过程中,一般采用决定系数和RMSE作为判定指标,但是在投递论文时发现,国外期刊对于指标的要求不止以上两种。常见的有以下几种:
(1)决定系数
为第i 个样本的某个组分的标准值;
为第i 个样本的相应组分的预测值;
为样品集相应组分的平均值。
在相同浓度范围的条件下,所建模型的决定系数的值越接近于1其相应模型的仿真效果越好。但是在实际建模过程中,一般设定的阈值为: 时刚好达到预测效果; 当
时预测效果较好,当
时, 预测效果最佳。
(2)残差均方根RMSE
在实际分析过程中,基本上所有的文献都是将所有数据的分为calibration set 和 validation set 或者prediction set,所以一般RMSE分为RMSEC 和RMSEP.。此外,一般还会选择进行交叉验证:crose validation ,所以还会有RMSECV等情况。
(3)标准分析误差SEE
为第 i 个样品的残差,即
;
为残差的平均值, 即
(4)相对分析误差 (relative percent deviation) RPD
相对分析误差是一种常用不常见的分析指标,为什么说交常用不常见?因为相对分析误差基于决定系数,在统计意义上,其分析指标间接等价于决定系数。其定义公式如下:
但是部分文献上将其定义为:
或:
其中SD为分析样本的标准偏差;SEC/SEP为分析样品的均方根误差。
相应的评判指标为:
RPD < 1.4 : 认为所建模型不可靠;
1.4 < RPD < 2.0 : 认为所建模型较可靠;
RPD > 2.0 : 则认为所建模型具备较高可靠性,能够用于模型分析。
个人新建立的weixin公众号,光谱学与光谱分析,欢迎大家关注