LDA文本建模

我们日常生活中会产生大量的文本,如果每一个文本存储为一个文档,那每篇文档从人的观察来说就是有序的词的序列。

统计文本建模的目的就是追问这些观察到语料库中的词序列是如何生成的。

我们将上述统计学问题看成上帝抛掷骰子生成的。那么出现两个核心的问题:
1.上帝都有什么样的骰子。即表示模型中都有哪些参数,骰子的每一面的概率都对应于模型中的参数。
2.上帝是如何抛掷这些骰子的。即表示游戏规则是什么,上帝会有不同类型的骰子,会按照一个什么样的方式来抛掷骰子产生词序列

LDA如下


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值