由于平均数受到极端值的影响较大,因此可以考虑将数据排序后,按照一定的比例截去两端的值,使用余下的数据求取平均值,这样得到的平均数称为截尾均数。
如果截尾均数和平均数的差异不大,表明原数据存在极端数据的情况不严重,或两侧极端值相抵消;反之则说明原数据存在极端数据,使用截尾平均数更能反应数据的集中趋势。
常用的截尾比例为5%,即排序后两端各去掉5%的数据。
由于平均数受到极端值的影响较大,因此可以考虑将数据排序后,按照一定的比例截去两端的值,使用余下的数据求取平均值,这样得到的平均数称为截尾均数。
如果截尾均数和平均数的差异不大,表明原数据存在极端数据的情况不严重,或两侧极端值相抵消;反之则说明原数据存在极端数据,使用截尾平均数更能反应数据的集中趋势。
常用的截尾比例为5%,即排序后两端各去掉5%的数据。