PRML(4)--Chapter2(下)-非参数估计

小陈同学-陈百万

于 2021-05-10 23:20:53 发布

阅读量113

点赞数

分类专栏： PRML

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_40624829/article/details/116603364

版权

PRML 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

PRML第二章下-非参数估计

1.直方图
2. 核方法
3. K近邻

概率密度建模-参数化方法-概率密度的形式一定，由数据集确定密度中的参数即可。

局限性–概率模型选的不对，不能够描述数据模态

此时，介绍一下非参数方法–直方图，核方法， K紧邻

1.直方图

直方图–密度估计–每个直方处密度, $n_i$ 该直方内的样本数，N总样本数， $\Delta$ 该直方宽度
$p_i=\frac{n_i}{N\Delta_i}$

缺点：

在直方交界处概率密度不连续
D维变量，每个维度都划分成 $M$ 维度，将会有 $M^D$ 个箱子。

估计某个特定位置的概率密度，应该考虑位于那个点的某个邻域内的数据点。
某个点处的概率密度–K 邻域内样本数， $N$ 总样本数， $V$ 邻域半径：
$p(x)=\frac{K}{NV}$

2. 核方法

固定邻域大小，计算邻域内样本数K。

Parzen 窗核函数密度估计(在窗中的才算):
$p(x)=\frac{1}{N}\sum_{n=1}^N\frac{1}{h^D}k(\frac{x-x_n}{h})$

高斯核密度估计(所有样本都算)：
$p(x)=\frac{1}{N}\sum_{n=1}^N\frac{1}{(2\pi h^2)^{\frac{D}{2}}}\exp{-\frac{||x-x_n||^2}{2h^2}}$

3. K近邻

固定邻域内样本数K，计算包含K个样本邻域体积。

由K近邻方法导出的K-NN 分类器。
数据集 $N_k$ 个样本属于类别 $C_k$ ,数据总数为 $N$ ，如果想对数据 $x$ 分类；以x为中心的球体中包含 $C_k$ 类样本 $K_k$ 个，x 与每个类别关联的概率：
$p(x|C_k)=\frac{K_k}{VN_k}$
类别先验：
$p(C_k)=\frac{N_k}{N}$

x的后验概率：
$p(c_k|x)=\frac{p(x,C_k)}{p(x)}=\frac{\frac{K_k}{VN_k}\frac{N_k}{N}}{\frac{K}{VN}}=\frac{K_k}{K}$

小陈同学-陈百万

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PRML(4)--Chapter2(下)-非参数估计

PRML第二章下-非参数估计1.直方图2. 核方法3. K近邻概率密度建模-参数化方法-概率密度的形式一定，由数据集确定密度中的参数即可。局限性–概率模型选的不对，不能够描述数据模态此时，介绍一下非参数方法–直方图，核方法， K紧邻1.直方图直方图–密度估计–每个直方处密度,nin_ini该直方内的样本数，N总样本数，Δ\DeltaΔ该直方宽度pi=niNΔip_i=\frac{n_i}{N\Delta_i}pi=NΔini缺点：在直方交界处概率密度不连续D维变量，每个维度
复制链接

扫一扫

专栏目录

小陈同学-陈百万 CSDN认证博客专家 CSDN认证企业博客

码龄7年

196: 原创

24万+: 周排名

37万+: 总排名

34万+: 访问

: 等级

4028: 积分

89: 粉丝

146: 获赞

83: 评论

805: 收藏

私信

关注

热门文章

分类专栏

MachineLearning 16篇
PaperNotes 22篇
MLTools 13篇
C++ 23篇
Python 26篇
PythonLibs 16篇
LinuxCommand 12篇
Git Tips 12篇
推荐系统 6篇
自然语言处理 10篇
PRML 4篇
学点数学 11篇
算法题 18篇
无数踩坑系列 7篇
JOTTING

最新评论

Linux(8)-Vim编辑器的使用
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。
Linux(4)-资源-du,top,free,shutdown,gnome
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。
Pytorch(1)-Tensor构建与统计分析
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
PythonLibs(10) - open (cvs, .json, .mat)
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
PythonLibs(9) - Logging
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加除了各种控件外，文章正文的字数；(3)使用更多的站内链接。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。