机器学习-白板推导-系列（一）笔记：频率派/贝叶斯派

最新推荐文章于 2023-08-06 16:53:05 发布

流动的风与雪

最新推荐文章于 2023-08-06 16:53:05 发布

阅读量481

点赞数 2

分类专栏：机器学习文章标签：机器学习白板推导极大似然估计贝叶斯估计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40061206/article/details/112371482

版权

机器学习专栏收录该内容

20 篇文章 4 订阅

订阅专栏

文章目录

0 笔记说明
1 数据与参数
2 频率派：θ为未知常量
3 贝叶斯派：θ为随机变量
4 最大后验概率（MAP）估计
5 贝叶斯预测
6 总结

0 笔记说明

来源于【机器学习】【白板推导系列】【合集 1～23】，我在学习时会跟着up主一起在纸上推导，博客内容为对笔记的二次书面整理，根据自身学习需要，我可能会增加必要内容。

注意：本笔记主要是为了方便自己日后复习学习，而且确实是本人亲手一个字一个公式手打，如果遇到复杂公式，由于未学习LaTeX，我会上传手写图片代替（手机相机可能会拍的不太清楚，但是我会尽可能使内容完整可见），因此我将博客标记为【原创】，若您觉得不妥可以私信我，我会根据您的回复判断是否将博客设置为仅自己可见或其他，谢谢！

本博客为（系列一）的笔记，对应的视频是：【(系列一) 绪论-资料介绍】、【(系列一) 绪论-频率派vs贝叶斯派】。

下面开始即为正文。

1 数据与参数

记数据集为X，X中有N个样本实例，每个样本有p个维度。用符号表示为X = (x₁,x₂,…,x_N)^T，x_i∈R^p，i=1…N。则X为N*P阶矩阵。

参数为θ时，X服从分布P(X|θ)，记作X～P(X|θ)。下面将分别介绍频率派与贝叶斯派对θ的不同看法。

2 频率派：θ为未知常量

频率派认为θ为未知常量，数据X为随机变量；频率派的做法是通过数据X去估计θ。

通过极大似然估计（Maximum Likelihood Estimate，MLE）去求θ：
在这里插入图片描述

3 贝叶斯派：θ为随机变量

贝叶斯派认为θ为随机变量，并且θ服从某随机分布P(θ)，即θ～P(θ)，称P(θ)为先验。

下面是贝叶斯估计（Bayesian estimation）：
在这里插入图片描述

4 最大后验概率（MAP）估计

MAP（最大后验概率）估计的思想与MLE（极大似然估计）一样，认为θ服从某随机分布，MAP估计做的也是找一个θ，使后验概率P(X|θ)最大：
在这里插入图片描述

5 贝叶斯预测

首先给一个公式，本节后续会用到：P(X=a,Y=b|Z=c)=P(X=a|Y=b,Z=c)P(Y=b|Z=c)。

数据集为X = (x₁,x₂,…,x_N)^T，x_i∈R^p，i=1…N。设x’为新数据，下面通过桥梁——θ来搭建X与x’的关系：
在这里插入图片描述
上面的公式中，由①到②用到了本节刚开始提到的那个公式；由②到③x’与X是独立的，因此可以直接省略X得到P(x’|θ)。

贝叶斯预测计算P(x’|X)时，必须先得到后验概率P(θ|X)，而贝叶斯估计就是计算P(θ|X)，这就是贝叶斯估计的意义所在。

6 总结

（1）贝叶斯派得到的模型叫做概率图模型，其本质为求积分；

（2）频率派得到的模型称为统计机器学习，其本质为优化问题（模型-损失函数-算法）。

END

流动的风与雪

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。