这是精算模型的第十部分,精算的非参数统计模型,从这一部分开始我们讨论精算建模的统计方法。在讨论统计方法的选择与应用之前,我们必须要明确精算的数据是什么样子的(数据类型),以及我们希望通过分析这些数据得到什么结论(分析目标),所以在正式介绍方法之前,这一讲简单介绍一下精算数据以及精算数据分析的目标。
数据类型
完整数据
如果对某个分布采样的取值没有限制,那么这样得到的样本数据就是完整数据(complete data)。假设要调查车险赔付数据,如果不存在免赔额与保单限额,且保险人全额支付保单损失,这样得到的数据就是完整数据。免赔额、保单限额、非全额支付会造成数据删失与截断,样本数据就不再是完整数据了。
如果完整数据能够得到每一个观测值的真实精确值,这样的数据就叫完整个体数据(complete individual data);但是如果总体分布是实数,数据观测与记录一定是有误差的,这时可以考虑用记录观测值的区间,并且当数据过于稠密的时候,也可以考虑对观测值进行分组,并只记录观测值的组别,这样的数据叫分组数据。
非完整数据
造成数据非完整的情况有两种,截断与删失。
在我们对某个总体进行采样时,超出某个范围的数据我们只记录范围不记录精确值,这种记录方式得到的数据叫做删失数据(censored data