统计中,当给出一系列的数据,我们希望知道数据的分布如何,例如给出一个班级的期末考试成绩,那么我们对成绩的分布很感兴趣,那么如何去对这个分布函数(或者是相应的密度函数)进行估计。本文总结几种常见的方式.
概率中密度函数是相应的分布函数的导数,那么一种思路就是估计这个导数,如下式:
p^(x)=1h(F(x+h)−F(x))=1h[#(xt≤x+h)−#(xt≤x)N]
关键就在第二个等式,通俗的讲,就是在x附近给出一个小区间h,统计落入其中的样本点,估计落入其中的概率,然后除以h,就是密度估计。一部分的密度函数估计就是形如第二个等式.
直方图估计
我们需要对所有样本所在的区间进行等分段,确定分段的起始点。公式如下: