非参数密度估计

在统计学中,非参数密度估计用于确定数据分布。本文介绍了直方图、质朴估计和核密度估计等方法。直方图通过等分区间估计分布;质朴估计计算每个小区间内的样本点数并除以总点数;核密度估计引入权重函数(核函数),考虑样本点对密度的影响,离得越近影响越大。
摘要由CSDN通过智能技术生成

统计中,当给出一系列的数据,我们希望知道数据的分布如何,例如给出一个班级的期末考试成绩,那么我们对成绩的分布很感兴趣,那么如何去对这个分布函数(或者是相应的密度函数)进行估计。本文总结几种常见的方式.
概率中密度函数是相应的分布函数的导数,那么一种思路就是估计这个导数,如下式:

p^(x)=1h(F(x+h)F(x))=1h[#(xtx+h)#(xtx)N]

关键就在第二个等式,通俗的讲,就是在x附近给出一个小区间h,统计落入其中的样本点,估计落入其中的概率,然后除以h,就是密度估计。一部分的密度函数估计就是形如第二个等式.

直方图估计
我们需要对所有样本所在的区间进行等分段,确定分段的起始点。公式如下:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值