《LDA数学八卦》读后笔记

这篇博客是作者阅读《LDA数学八卦》后的笔记,重点解析了伽马函数、Beta分布、Dirichlet分布在LDA中的作用,以及MCMC和Gibbs采样方法。通过简化复杂的数学概念,帮助初学者更好地理解LDA的文本建模过程。
摘要由CSDN通过智能技术生成

LDA看过很多次了,每次都有新的理解(其实就是因为之前的理解不深)。首先要表达对靳志辉的敬仰,毕竟LDA资料里面,这个算是最好的读物了。
看完LDA多次想过要写一篇博客,但是一直没有写,因为我觉得我还没有理解,直到今天,我也不太敢说自己百分百的理解。我就把自己学习过程中的心得,写出来,供初学者参考,少走一些我走过的弯路就OK了。接下来,我会完全按照《LDA数学八卦》的排版顺序来解读。
先大概说下这本书的框架
介绍了伽马函数,Beta分布,Dirichlet分布,采样方法,然后讲文本建模。
第一要点:伽马函数,Beta分布都是为了引出Dirichlet分布,而Dirichlet分布则是用来表示文本的先验分布。也就是是说,这个slide里面用大量的篇幅来介绍,伽马,Beta,Dirichlet就是用来解决一个先验分布表示的问题。我们带着这样的整体认识再看这个slide,我们就会觉得轻松很多,很多地方是可以直接不看的。也就是说,我们不用沉醉于伽马函数有多神奇,不用纠结于高斯有多老狐狸。因为这些非但没有让你更加清楚认识,反而让你更蒙圈。这个slide就这点不好,他把那么多篇幅用在了铺垫上,但是在后面关键部分匆匆结尾。
第二要点: 采样方法,两种采样算法要理解,mcmc和gibbs采样,这两个采样算法稍微耐心点了解之后,其实LDA部分的知识也就全知道了。
以上两点只要理解好了,LDA也就会了,Nothing is important but these two points!

现在我们就按着《LDA数学八卦》把知识都过一遍,用最朴素的语言来说明。
伽马函数
我们只需要记住这个函数的形式,性质,以及他可以表示Beta分布和Dirichlet分布。
形式:
这里写图片描述
性质:

  • 11
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值