来呗,被马尔可夫链虐一下:斯坦福统计大咖王永雄教授笔记你要不要看

640?wx_fmt=jpeg

讲座视频:


讲座题目:Mini-batching in Markov Chain MonteCarlo Inference

讲座分为三部分:

 1.mini-batch tempered MCMC

即在抽样问题中,如果目标分布不能很容易地直接抽样,用Markov ChainMonte Carlo (以下简称MCMC) 方法可以有效地解决这个问题。构造一条马氏链,使得它的极限分布是目标分布,迭代多次之后可以近似地得到目标分布的样本。Metropolis-Hastings (MH) 算法是 MCMC 方法中最常用的算法之一。当我们要抽参数的后验分布时,M-H 算法计算 M-H ratio 的时候需要用到全部数据。但是当数据量很大时,这个方法就不会有很高的效率。如果用 mini-batch 的方法,每次只需要计算少量数据的信息,可以有效地提高效率。由此引入了报告主要研究的问题 mini-batch tempered MCMC。

 

2.MINi-batch Tempered Equi-Energy Sampler

由于 MINT 算法抽样得到的样本并不是真的后验分布,只是后验分布升温后的一个版本。如果我们想要得到真实的后验分布的样本,王教授介绍了 equi-energy (EE) sampler的办法(Kou, Zhou andWong, 2006)。原来的EE方法可以有效地解决分布多峰(multi-mode)的问题,但是对后验分布抽样时,MCMC方法每一步还是需要所有数据的信息。把 MINT 和 EE 方法结合起来,可以得到 MINi-batch TemperedEqui-Energy (MINTEE) 算法。MINT可以有效地从高温分布中抽样;EE方法要求从最高的温度开始,在每个温度中都抽相应的马氏链,并不断更新EE set,最低温分布就是目标分布,可以得到想要的样本。同样地,MINTEE 方法在实际应用中有很高地效率,计算复杂度也比EE方法小。

 

3. The cone move的方法 

在机器学习里面流行的Langevin Dynamics方法,每次马氏链更新的时候,proposal distribution 的期望会沿着梯度方向,而这种方法会使proposal distribution 的反向概率 (reverse probability) 很小,从而导致 M-H ratio 也非常小,马氏链很难转移出去,抽样效率低。王教授介绍的方法是提出一个新的proposal distribution,空间上像是把两个圆锥反向按顶点接在一起,它在正负梯度上有着相同的概率,这样每次马氏链的转移是可逆的(reversible),效率会更高一些。

 

QA环节,老师和同学们讨论了和MINT 方法相关的问题:能否把 MINT 方法运用在Gibbs 抽样的框架之下?MINTEE 方法中,不同温度下的马氏链可不可以在不同温度之间进行转移等等。王教授回答到,在Gibbs抽样中运用mini-batch方法是十分有趣也十分有挑战的问题,期望看到更多的相关的进展。对于后一个问题,在parallel tempering方法中,多条马氏链可以在不同温度之间交换,而在EEsampler方法里,高温的马氏链可以帮助指导或影响低温的马氏链,低温对高温是不会有影响的。

(课程内容总结来自于清华大学统计学研究中心官方平台水木数据派)

 

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

(完)

再帮忙给清华和普度的1+1项目打一个小广告:

如果想学习数据科学或者转行的小伙伴可以了解下:

第一年:修读规定课程,成绩都要合格;

第二年:学业和英语成绩均符合普度大学研究生招生基本要求的学员,若成功申请普度大学统计学硕士,普度方面认可其在清华学硕士培养方案中第一年课程。

怎么样,时间和金钱都节省了。

还不了解一下:

http://u6396477.viewer.maka.im/pcviewer/BHK9GHIO

640?wx_fmt=png

640?wx_fmt=jpeg

640?wx_fmt=gif

出品:谭婧

美编:陈泓宇


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值