核密度估计python_核密度估计丨数析学院

原标题:核密度估计丨数析学院

核密度估计(kernel density estimation)是非参数统计检验中的重要方法之一,常用于估计未知的密度函数。本节将向大家介绍在 Python 中如何利用 Scikit-Learn 库中的相关工具,对数据集的样本分布进行核密度估计。

导入可视化库:

构建示例数据:

可以看到,构建的数据为一维的随机数组,我们对其中后2/3的样本加上整数5。处理之后,其频率分布直方图如下所示:

根据频率分布直方图的性质,所有柱形对应的频率之和为1:

频率分布直方图是非参数统计中的重要可视化方法,为了演示方便,我们构造一组规模相对较小的数据集:

在 Python 中,我们可以自定义直方图中的分组。下面我们用两种不同的分组方式,绘制两幅频率分布直方图,并将数据集中每个样本的值标注在横轴刻度下方。其中,右图为将默认的分组边界向右平移0.6之后的频率直方图结果:

未完待续:

课程内容较多,请复制链接通过电脑学习,获得最佳学习效果。

http://datacademy.io/lesson/148

更多课程和文章尽在微信号:

「datartisan数据工匠」

责任编辑:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值