机器学习-白板推导系列笔记（二十四）-直面配分函数

最新推荐文章于 2021-03-25 11:59:44 发布

VIP文章及时行樂_

最新推荐文章于 2021-03-25 11:59:44 发布

阅读量458

点赞数 3

分类专栏：哔站机器学习白板推导文章标签：机器学习深度学习

本文链接：https://blog.csdn.net/qq_41485273/article/details/112251518

版权

此文章主要是结合哔站shuhuai008大佬的白板推导视频：直面配分函数_134min

全部笔记的汇总贴：机器学习-白板推导系列笔记

直面配分函数-对应花书第十八章

动机：Learning问题、evaluation问题

一、对数似然梯度

$x\in \R^p,\{0,1\}^p$

许多概率图模型（通常无向图模型），由一个为归一化的 $\hat p(x;\theta)$ 定义，我们必须除以一个配分函数 $Z(\theta)$ 来归一化， $p(x;\theta)=\frac1{Z(\theta)} \hat p(x;\theta)$

配分函数 $Z(\theta)$ 是对未归一化概率所有状态的积分或者求和：
$Z(\theta)=\int \hat p(x){d}x\;\;\;\;\;or\;\;\;\;\;\;Z(\theta)=\sum_x\hat p(x)$

ML learning:Given $X=\{x_i\}^N_{i=1},estimate:\theta$

$\theta=\underset{\theta}{\argmax }p(x;\theta)=\underset{\theta}{\argmax}\prod^N_{i=1}p(x_i;\theta)$
引入一个 $\log$
$\theta=\underset{\theta}{\argmax}\log\prod^N_{i=1}p(x_i;\theta)\\=\underset{\theta}{\argmax}\sum^N_{i=1}\log p(x_i;\theta)\\=\underset{\theta}{\argmax}\sum^N_{i=1}(\log \hat p(x_i;\theta)-\log Z(\theta))\\=\underset{\theta}{\argmax}\sum^N_{i=1}\log \hat p(x_i;\theta)-N\cdot\log Z(\theta)\\=\underset{\theta}{\argmax}\frac1N\sum^N_{i=1}\log \hat p(x_i;\theta)-\log Z(\theta)\\（提一个N对计算无影响）$
$l(\theta)=\frac1N\sum^N_{i=1}\log \hat p(x_i;\theta)-\log Z(\theta)$

求梯度，

$\nabla_\theta l(\theta)=\frac1N\sum^N_{i=1}\nabla_\theta\log \hat p(x_i;\theta)-\nabla_\theta\log Z(\theta)$

$\nabla_\theta\log Z(\theta)=\frac1{Z(\theta)}\nabla_\theta Z(\theta)\\=\frac{p(x;\theta)}{\hat p(x;\theta)}\nabla_\theta \int \hat p(x){d}x\\=\frac{p(x;\theta)}{\hat p(x;\theta)}\int\nabla_\theta \hat p(x){d}x\\=\int\frac{p(x;\theta)}{\hat p(x;\theta)}\nabla_\theta \hat p(x){d}x\\=\int{p(x;\theta)}\nabla_\theta \log \hat p(x){d}x\\=E_{p(x;\theta)}[\nabla_\theta \log \hat p(x)]$

二、随机最大似然

$\nabla_\theta l(\theta)=\frac1N\sum^N_{i=1}\nabla_\theta\log \hat p(x_i;\theta)-E_{p(x;\theta)}[\nabla_\theta \log \hat p(x;\theta)]\\=\underset{postive\;phase}{\underbrace{E_{P_{data}}[\nabla_\theta\log \hat p(x;\theta)]}}-\underset{negative\;phase}{\underbrace{E_{P_{model}}[\nabla_\theta \log \hat p(x;\theta)]}}$

最低0.47元/天解锁文章

及时行樂_

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
机器学习-白板推导系列笔记（二十四）-直面配分函数

此文章主要是结合哔站shuhuai008大佬的白板推导视频：直面配分函数_134min全部笔记的汇总贴：机器学习-白板推导系列笔记直面配分函数-对应花书第十八章动机：Learning问题、evaluation问题一、对数似然梯度x∈Rp,{0,1}px\in \R^p,\{0,1\}^px∈Rp,{0,1}p许多概率图模型（通常无向图模型），由一个为归一化的p^(x;θ)\hat p(x;\theta)p^(x;θ)定义，我们必须除以一个配分函数Z(θ)Z(\theta)Z(θ)来归一化，
复制链接

扫一扫