LDA(Lanton Dirichlet Allocation)浅显理解0.1

本文介绍了LDA(Latan Dirichlet Allocation)主题模型的基本思想,通过逐步解析Unigram Model、Mixture of Unigrams、pLSI到LDA的过程,阐述了LDA如何动态地处理主题和词汇的概率分布。同时,文章对比了pLSA与LDA的差异,并提及了相关知识点如gamma函数、Dirichlet分布和贝叶斯框架。
摘要由CSDN通过智能技术生成

这一段时间在看LDA主题模型,这里说一下我对LDA的理解,抛开复杂的数学、概率论、机器机器学习算法,只说思路,其他内容以后再更加详细的写。
假设有一个机器人,他想写一篇文章,每篇文章包含N个词,那么他怎么写呢???
这里写图片描述

1、Unigram model

科学家A一开始这么设计,先给机器人读大量的文章,这样这个机器人的大脑中会有S个词,这些词组成了词向量 W=[w1,w2,w3......wS] ,每一个词都有相对应的概率 P=[p(w1),p(w2),p(w3)......p(wS)
算法如下:


for i = 1 to N:
  choose a word wip(W)


数学表示即:

p(w)=p(wn)
这里写图片描述

2、Mixture of unigrams

科学家B觉得不应该这样,他认为机器人读的这些文章分成不同的主题 Z=[z1,z2....

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值