(一)误差类型
偶然误差(随机误差、不定误差、真误差):在相同的观测条件下作一系列的观测,如果误差在大小和符号上都表现出偶然性,即从单个误差看,该列误差的大小和符号没有规律性,但就大量误差的总体而言,具有一定的统计规律,这种误差称为偶然误差。
系统误差:在相同的观测条件下作一系列的观测,如果误差在大小、符号上表现出系统性,或者再观测过程中按一定的规律变化,或者为某一常数,那么,这种误差就称为系统误差。
粗差(粗大误差):指比在正常观测条件下所可能出现的最大误差还要大的误差,通俗地说,粗差要比偶然误差大上好几倍。
相对误差:绝对误差所占真实值的百分比。
绝对误差:是测量值与真实值之差的绝对值。
(二)衡量精度的指标
方差:数据偏离平均值的平方和的平均。
标准差:标准差(Standard Deviation) ,又常称均方差,标准差是数据偏离平均值的平方和平均后的方根,用δ表示。标准差是方差的算术平方根。
均方误差(Mean Square Error) (MSE):均方误差是各数据偏离真实值的距离平方和的平均数,也即误差平方和的平均数,计算公式形式上接近方差。
基准真相:(ground truth)是一个相对概念;它是指相对于新的测量方式得到的测量值,作为基准的,由已有的、可靠的测星方式得到的测量值(即经验证据)。人们往往会利用基准真相,对新的测量方式进行校准,以降低新测量方式的误差和提高新测量方式的准确性。
中误差、均方根(误)差(Root Mean squared error) (RMSE):均方误差的开方叫均方根误差,是观测值与真值偏差的平方和与观测次数n比值的平方根,均方根误差和标准差形式上接近。衡量的是观测值与真实值之间的偏差,并且对数据中的异常值较为敏感。
平均绝对误差(Mean Absolute Error ) (MAE):是绝对误差的平均值,也就是测量值与真值之间误差的平均,能更好地反映预测值误差的实际情况。
中误差
平均误差(θ):在一定的观测条件下一组独立的偶然误差的绝对值的数学期望称为平均误差。
或然误差(ρ):或然误差ρ
的定义是,误差出现在(-ρ
,ρ
)之间的概率等于1/2。
(三)精度、准确度与精确度
精度:是指误差分布的密集或离散程度。由中误差定义式知,精度也表示各观测结果与其数学期望的接近程度。
准确度:又名准度,表征了观测结果系统误差大小的程度。衡量系统误差大小程度的指标是准确度。
精确度:是精度和准确度的合成,是指观测结果与其真值的接近程度,包括观测结果与其数学期望接近程度和数学期望与其真值的偏差。因此,准确度反映了偶然误差和系统误差联合影响的大小程度。