机器学习-白板推导 P1

最新推荐文章于 2023-07-29 14:09:01 发布

无知书童

最新推荐文章于 2023-07-29 14:09:01 发布

阅读量373

点赞数

分类专栏： # 机器学习白板推导文章标签：频率贝叶斯

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_28404829/article/details/100551723

版权

机器学习白板推导专栏收录该内容

25 篇文章 1 订阅

订阅专栏

机器学习-白板推导 P1

频率派VS贝叶斯派

频率派VS贝叶斯派

符号定义

$\begin{aligned} & X:data \rightarrow X=(x_1 \; x_2 \; ...\;x_N)^T_{N \times p} = \begin{bmatrix} x_{11} & x_{12} & \cdots &x_{1p} \\ x_{21} & x_{22} & \cdots&x_{2p} \\ \vdots & \vdots & \ddots & \vdots \\ x_{N1} & x_{N2} & \cdots &x_{Np} \end{bmatrix}_{N \times p }\\ & \theta:parameter \\ & x \sim p(x|\theta) \end{aligned}$

频率派

思想
$\theta$ 是未知的常量， $X$ 是随机变量。所以频率派估计 $\theta$ 。
方法
MLE极大似然估计
$\theta_{MLE} = arg\max_\theta log p(x|\theta)$
频率派->统计机器学习
优化问题

贝叶斯派

思想
$\theta$ 也是随机变量， $\theta \sim p(\theta)$ , 一般称 $p(\theta)$ 为先验。
先验(prior)： $P(\theta)$
后验(posterior)： $p(\theta|x)$
似然(likehood)： $p(x|\theta)$
$p(x)=\int_\theta p(x|\theta)p(\theta) d{\theta}$
$p(\theta|x) = \frac{p(x|\theta)p(\theta)}{p(x)}$
方法
MAP极大后验概率
由于 ${p(x)}$ 为常数
$\theta_{MAP} = arg\max_\theta p(\theta | x) = arg\max_\theta p(x|\theta)p(\theta)$
贝叶斯估计:
$p(\theta|x)=\frac{p(x|\theta)p(\theta)}{\int_\theta p(x|\theta)p(\theta) d{\theta}}$
贝叶斯预测：
已知样本数据 $X$ ，新数据 $\hat{x}$ ，求 $p(\hat{x} | X)$ 。
$\begin{aligned} p(\hat{x} | X) &= \int_\theta p(\hat x, \theta| X) d \theta \\ & = \int_\theta p(\hat x | \theta) p(\theta | X) d \theta \end{aligned}$

注意：
$p(\hat x, \theta| X)=p(\hat x | \theta X) p(\theta | X)$
是否是因为考虑 $\hat x$ 与 $X$ 独立，所以
$p(\hat x, \theta| X)=p(\hat x | \theta) p(\theta | X)$

贝叶斯->概率图模型
求积分问题 Monte Carlo Method

B站链接：
https://www.bilibili.com/video/av31950221?from=search&seid=8309397892501615322

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

无知书童 CSDN认证博客专家 CSDN认证企业博客

码龄9年

129: 原创

23万+: 周排名

168万+: 总排名

14万+: 访问

: 等级

2298: 积分

53: 粉丝

65: 获赞

13: 评论

288: 收藏

私信

关注

热门文章

分类专栏

最新评论

4 傅里叶级数的复数形式
流星奶香包: 注意一下，“欧拉公式”中的sinθ公式有误，应该是 sinθ=-i/2[e^(iθ)-e^(-iθ)]。作者此处没有乘以i。
Question Answering over Freebase via Attentive RNN with Similarity Matrix based CNN
njz: 你确定这是acl 2018文章，希望能严谨点 https://acl2018.org/programme/papers/
1 三角函数的正交性
duangduangduang136: gch别学咯
Knowledge Base Question Answering via Encodin of Complex Query Graphs
x2213500360: 我对博主在文中提到的几点的看法：首先是查询图生成中，类型链接，意思应该是粗鲁地结合一个词、两个词或者三个词构成提及(mentions)，例如图2a中，US 和 president这两个词构成类型的提及，与这个类型提及相似度高的两个类型是us_president和us_vice_president。其次是类型约束，只接收答案节点IsA谓词的约束。在图2d中给出了例子，答案节点A的类型是us_president，用谓词约束IsA相连，其他的谓词约束不接收意思应该是只考虑谓词是IsA约束。最后的问题：为什么会得到多个 q 向量，问题不是只有一个，难道是局部压缩有多个？每一个q都是由全局信息和不同的局部信息构成的，它的局部信息与语义组件是相对应的。可以认为一个语义组件表示句子中的一部分局部语义信息，这一部分局部语义信息与q向量的局部信息是对应的。但是我也不太懂例子中第二和第三个语义组件对应的局部依赖序列应该是怎么样的，希望有大佬解答。以上都是个人理解，有理解错误的地方还请指出。
2 线性化泰勒级数泰勒公式
Miaaam: 能问问为什么x-x0还在吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。