1.9统计（stat）

最新推荐文章于 2024-02-22 17:17:16 发布

VIP文章 Fortuna_i

最新推荐文章于 2024-02-22 17:17:16 发布

阅读量1.7k

点赞数 1

分类专栏： Spark 文章标签： Spark Mllib 机器学习算法统计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Fortuna_i/article/details/87296851

版权

1.9 统计（stat）

1.9.1 核密度估计（KDE(Kernel Density Estimation)）

由给定样本集合求解随机变量的分布密度函数问题是概率统计学的基本问题之一。解决这一问题的方法包括参数估计和非参数估计。

参数估计又可分为参数回归分析和参数判别分析。在参数回归分析中，人们嘉定数据分布符合某种特定的性态，如线性、指数性态等，然后在目标函数族中寻找特定的解，即确定回归模型中的未知参数。在参数判别分析中，人们需要假定作为判别依据的、随机取值的数据样本在各个可能的类别中都服从特定的分布。参数模型的这种基本假定与实际的物理模型之间常常存在较大的差距，这些方法并非总能取得令人满意的结果。针对上述缺陷，提出了非参数估计方法，即核密度估计方法。由于核密度估计方法不利用有关数据分布的先验知识，对数据分布不附加任何假定，是一种从数据样本本身出发研究数据分布特征的方法，因而在统计学理论和应用领域受到高度重视。

核密度估计（KDE(Kernel Density Estimation)）在概率论中是用来估计未知的密度函数的一种方法，属于分参数检验方法之一。主要是根据密度函数来计算集合中各个项的分布情况。其中密度函数是以各个数值为中心进行计算。所谓核密度估计，就是采用平滑的峰值函数（“核”）来拟合观察到的数据点，从而对真实的概率分布曲线进行模拟。

x1, x2......xn为独立同分布F的n个样本点，设其概率密度函数为f，核密度估计为下：

K(.)为核函数（非负、积分为1，符合概率密度性质，并且均值为0）。

h>0，为一个平滑参数，称作带宽(bandwidth)。

Kh(x) = 1/h K(x/h). 为缩放核函数(scaled Kernel)。

核密度函数的原理比较简单，在我们知道某一事物的概率分布的情况下，如果某一个数在观察中出现了&#x

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
1.9统计（stat）

1.9 统计（stat）1.9.1 核密度估计（KDE(Kernel Density Estimation)）由给定样本集合求解随机变量的分布密度函数问题是概率统计学的基本问题之一。解决这一问题的方法包括参数估计和非参数估计。参数估计又可分为参数回归分析和参数判别分析。在参数回归分析中，人们嘉定数据分布符合某种特定的性态，如线性、指数性态等，然后在目标函数族中寻找特定的解，即确定回归模...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。