机器学习理论基础学习11--- 变分推断

最新推荐文章于 2024-04-18 10:34:21 发布

dili8870

最新推荐文章于 2024-04-18 10:34:21 发布

阅读量384

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/nxf-rabbit75/p/10382266.html

版权

一、背景（为什么要有变分推断？）

简单来说便是需要根据已有数据推断需要的分布P；当P不容易表达，不能直接求解时，可以尝试用变分推断的方法。即，寻找容易表达和求解的分布Q，当Q和P的差距很小的时候，Q就可以作为P的近似分布代替P。

二、公式推导

三、总结

变分推断是利用已知分布通过调整使其符合我们需要却难以用公式表达的分布。由ELOB和KL散度的关系，通过得到ELOB的上界间接获得散度

　　　　 $KL(Q(z)||P(z|x))$

对于ELOB的上界，又可以通过转化为相关的散度求解

　　　　 $KL(\Bbb{E}_{i\neq j}[\ln{P(x,z)}]||Q_j(z_j))$

$\begin{align*} KL(\Bbb{E}_{i\neq j}[\ln{P(x,z)}]||Q_j(z_j))\to ELOB\to KL(Q(z)||P(z|x)) \to 调整后的Q(z) \end{align*}$
　　

用一张图来表示Q分布的变化:

参考文献：

【1】Variational Inference 变分推断

【2】机器学习-白板推导系列-变分推断（Variational Inference）

转载于:https://www.cnblogs.com/nxf-rabbit75/p/10382266.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

dili8870

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

机器学习(2) 变分推断

GZHermit的博客

03-26

3988

变分对于普通的函数f(x)f(x)，我们可以认为ff是一个关于xx的一个实数算子，其作用是将实数xx映射到实数f(x)f(x)。那么类比这种模式，假设存在函数算子FF，它是关于f(x)f(x)的函数算子，可以将f(x)f(x)映射成实数F(f(x))F(f(x)) 。对于f(x)f(x)我们是通过改变x来求出f(x)f(x)的极值，而在变分中这个xx会被替换成一个函数y(x)y(x)，我们通过

变分推断

github_36129812的博客

09-13

2120

在机器学习中经常会遇到某个分布的期望的情况，简单的情况还好，但是一旦遇到难以计算或者估计的复杂分布，那么问题将变得难以处理。变分推断在机器学习上就是用来解决找到某种简单形式的分布来近似估计某个复杂分布的问题。

参与评论您还未登录，请先登录后发表或查看评论

深度探索：机器学习中的变分推断算法原理及其应用

qq_51320133的博客

04-18

2832

变分推断作为一种强大的近似推断技术，在机器学习领域展现出了显著的应用价值和广阔前景。尽管存在近似误差、依赖变分族选择等局限性，但随着理论研究的深入和技术手段的进步，如变分推断的深度学习化、自适应变分族设计、基于梯度的采样方法等，这些挑战正在逐步得到缓解。未来，我们期待变分推断能够在更大规模、更高维度、更复杂结构的模型中发挥关键作用，进一步推动机器学习在科学研究、工程技术和社会经济等领域的应用发展。

VI变分推断

weixin_43458628的博客

04-15

235

变分推断 我们已经知道概率模型可以分为，频率派的优化问题和贝叶斯派的积分问题。从贝叶斯角度来看推断，对于 x^\hat{x}x^ 这样的新样本，需要得到： p(x^∣X)=∫θp(x^,θ∣X)dθ=∫θp(θ∣X)p(x^∣θ,X)dθ p(\hat{x}|X)=\int_\theta p(\hat{x},\theta|X)d\theta=\int_\theta p(\theta|X)p(\hat{x}|\theta,X)d\theta p(x^∣X)=∫θp(x^,θ∣X)dθ=∫θp(θ∣X)p(

机器学习系列：变分推断

qq_39068872的博客

03-29

383

1. Introduction 我们已经知道概率模型可以分为，频率派的优化问题和贝叶斯派的积分问题。从贝叶斯角度来看推断，对于 x^\hat{x}x^ 这样的新样本，需要得到： p(x^∣X)=∫θp(x^,θ∣X)dθ=∫θp(θ∣X)p(x^∣θ,X)dθ p(\hat{x}|X)=\int_\theta p(\hat{x},\theta|X)d\theta=\int_\theta p(\th...

变分推断|机器学习推导系列（十四）

weixin_42431920的博客

08-29

564

一、概述对于概率模型来说，如果从频率派角度来看就会是一个优化问题，从贝叶斯角度来看就会是一个积分问题。从贝叶斯角度来看，如果已有数据xxx，对于新的样本x^\hat{x}x^，需要得到： p(x^∣x)=∫θp(x^,θ∣x)dθ=∫θp(x^∣θ,x)p(θ∣x)dθ=x^与x独立∫θp(x^∣θ)p(θ∣x)dθ=Eθ∣x[p(x^∣θ)]p(\hat{x}|x)=\int _{\theta }p(\hat{x},\theta |x)\mathrm{d}\theta =\int _{\theta

机器学习之变分推断

weixin_45610907的博客

08-21

419

概率模型的中心任务就是求潜变量的后验概率分布pZ∣X，以及关于该后验的期望。前者是推断，后者是决策。px∣X∫Zpx∣ZpZ∣XdZEpZ∣Xpx∣Z)]由此可见，对于后验概率分布的求解是十分重要的。。具体地，对于连续型随机变量，积分可能没有解析解，同时由于空间维度过高和被积函数复杂导致没有数值解；对于离散型随机变量，理论上是可以计算的，但是隐含状态的数量可能有指数多个，从而导致精确计算的计算代价过大。

《模式识别与机器学习》 - Christopher Bishop 详细介绍了模式识别和机器学习的基础理论和技术

最新发布

08-01

该书以统计学习理论为基础，详细讨论了各种算法和模型，并通过大量的实例和习题帮助读者理解和应用这些方法。章节概述 机器学习和模式识别的基本概念和应用领域。概率论基础，概率分布及其在模式识别中的应用。 ...

机器学习之变分推断(三)基于平均场假设变分推断与广义EM

静静的学习就好

09-18

1356

上一节介绍了基于平均场假设的变分推断推导过程。本节将介绍平均场假设变分推断与广义EM之间的联系。

机器学习算法推导第十二章 变分推断1

08-04

【机器学习算法推导第十二章 变分推断1】在机器学习中，我们经常面临一个问题：如何处理复杂的概率分布。当我们想要估计一个难以直接求解的概率分布p时，变分推断提供了一种有效的近似方法。变分推断的目标是找到...

胡海昌的变分学（学习变分的经典入门）

03-05

胡海昌的《变分学》这一本书给予了我无穷的吸引力，今后的我会无数次的阅读欣赏她的美妙的旋律，但是这不代表她真的就是那么完美无暇，首先这本书仅仅是一个数学变分学这一分支的科普书籍，因为她的知识结构严重的不完善，其次这本书虽然名为“变分学”其实际上应该是作为有限元学习的科普读物。但是尽管这本书还有这么多不足之处，但是这也不可以就全盘否认她的魅力所在！总得来说我对此书的打分应该是满分！

AI人工智能课程 机器学习算法班第20讲：采样与变分共26页.pdf

07-14

- **理论基础**：介绍变分推断的基本思想，以及如何应用于LDA模型的主题推断。 - **实施步骤**：详细讲解LDA模型的变分推断实施步骤，包括初始化、迭代更新以及收敛判断等。 8. **实战案例**： - **纯手工实现...

机器学习笔记之玻尔兹曼机(三)梯度求解(基于平均场理论的变分推断)

静静的学习就好

12-24

1683

上一节介绍了使用马尔可夫链蒙特卡洛方法(MCMC)处理波尔兹曼机模型参数梯度求解过程中概率分布不可求的问题，本节将介绍变分推断方法处理梯度问题。

【扩散模型】（一） 变分推断基础

liteng607的博客

07-15

480

扩散模型（Diffusion Model）、变分自编码器（Variational Auto-Encoder，VAE）、变分贝叶斯（Variational Beyes）

机器学习笔记之变分推断(二)公式推导过程(基于平均场假设)

静静的学习就好

09-15

2207

上一节介绍了分别从频率角度和贝叶斯角度认识机器学习问题，并介绍了推断(Inference)在整个贝叶斯角度的重要作用。本节将正式介绍确定性近似推断的代表方法——变分推断(Variational Inference)

学习和推断

weixin_30739595的博客

10-07

183

在机器学习里面经常遇到推断和学习两个词，下面对其进行区分。图模型通常包括三种节点,观测变量、隐变量和参数, 分别用表示。习惯上把计算隐变量分布的过程称作推断,把对参数的后验估计称作学习。具体的,推断是指计算的过程, 而学习是计算的过程。在上面的过程中,如果先验分布是均匀分布,那么极大后验估计就退化成了极大似然估计。这样的区分是有一定道理的,通常情况下,参数的个数是相对较少的,...

【文生图系列】基础篇-变分推理（数学推导）

陶将的博客

06-18

3969

此篇博文主要介绍什么是变分推理(Variational Inference , VI)，以及它的数学推导公式。变分推理，是机器学习中一种流行的方式，使用优化的技术估计复杂概率密度。变分推理的工作原理：**首先选择一系列概率密度函数，然后采用KL散度作为优化度量找到最接近于概率密度的函数**。引入evidence lower bound的方法更容易计算近似概率。

机器学习---学习与推断，近似推断、话题模型

weixin_43961909的博客

02-10

1603

基于概率图模型定义的分布，能对目标变量的边际分布（marginal distribution）或某些可观测变量。假设图模型所对应的变量集x＝｛x1，x2，···，xn｝能分为XE和XF两个不相交的变量集，推断问。其中，联合概率p（xF，xE）可基于图模型获得，所以推断问题的关键就在于如何高效计算边际分。概率图模型的推断方法可以分两类：①精确推断方法：计算出目标变量的边际分布或条件分布的精。为条件的条件分布进行推断。确值，一般情况下，该类方法的计算复杂度随极大团规模增长呈指数增长，适用范围有限。

机器学习笔记之概率图模型(六)推断基本介绍

静静的学习就好

10-22

1337

前面部分分别介绍了贝叶斯网络(Bayessian Network)和马尔可夫随机场(Markov Random Field)的结构表示(Representation)，本节开始将介绍概率图模型的第二部分——推断(Inference)。