搞了好长时间的BNP,但是翻来覆去这个MH算法还是不太明白,在这里记几个点来帮助理解。
教材还是主要看的LDA数学八卦,写的不错,不过我理解的比较慢,感觉有些地方讲得有点太粗了,油管上有不少视频讲的很好(Daphne Koller的),可以看看。说MH之前得先说MCMC。
1.接受率的意义
这个东西不太好理解,因为其他机器学习的地方根本就没有,太抽象。下面要开始理解了。
重点1,平时看到的概率密度函数的意义是 在X这个点上有多大概率出现一个事件 Y轴越高的代表出现的概率越高 这个大家都明白但是关键时候就忘了 所以一定得记住。
重点2,有一个Q分布叫做proposal distribution, 意思是我给你一个建议的分布,他非常要非常像要采样的分布P。这时候接受率就要起作用了,他要做的就是防止这个Proposal distribution走偏了,要指导着他往要采样的分布P走。例子,现在我采了一个点,现在要采下一个了,然后随便采了一个点,这时候就得看接受率了。如果接受率很低,就说明要采样的分布P这里本来就不会出现多少点,所以接受率就是你别采这里,这里在P上概率不高,你返回刚才