贝叶斯规则和LDA主题模型

本文介绍了共轭先验和共轭分布的概念,重点探讨了贝叶斯方法在二项分布和多项分布中的应用。在有限数据量下,贝叶斯方法与频率方法的参数估计差异。此外,还详细讲解了LDA(Latent Dirichlet Allocation)主题模型,包括其生成过程和参数学习,强调了α和β参数在模型中的作用。
摘要由CSDN通过智能技术生成
共轭先验和共轭分布

P( θ ) 先验分布、P( θ|X )后验分布、P(X | θ )似然函数。
后验分布=先验分布*似然函数/P(X)
使得先验分布和后验分布具有相同的形式,称他们是共轭分布;先验分布称为相应似然函数的共轭先验。
似然函数是关于统计模型中的参数的函数,表示模型参数的似然性,用于在已知观测所得到的结果时,对模型的参数进行估计。

Beta分布是二项分布的共轭先验分布;狄利克雷分布是多项式分布的共轭先验分布。

二项分布的似然函数(n次独立的伯努利试验): L= ps(1p)f

Beta中先验分布为X~Beta( α , β ) ,后验分布为X~Beta( α +s, β +f),超参数变了,对于新增的观测值,后验分布又可作为先验分布来计算,乘以似然函数得到修正后的新后验,通过求后验均值得到参数的估计。这种序列方法非常适合实时学习场景。

当拥有无限数据量时(beta分布中s和f都趋向于无穷,狄利克雷分布中m趋向于无穷),贝叶斯方法和频率方法得到的参数估计是一致的;在有限数据量下,贝叶斯的参数后验均值介于先验均值和频率方法的估计参数。

多项分布的似然函数(K个状态,概率分布为 μ=(μ1,μ2,..,μk ) :
L= Kk=1

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值