- 博客(2)
- 收藏
- 关注
原创 Latent Dirichlet Allocation(LDA主题模型)
LDA主题模型 符号与术语 词word为离散数据的一个基本单位,使用一个{1,…,V}的词表索引。其中的V是整个语料库中的词的个数。 LDA中的参数求解问题 LDA对应的概率图模型: 我们现在使用LDA面临的首要问题是推断给定文档的隐变量z的后验概率。 p(θ,z∣w,α,β)=p(θ,z,w∣α,β)p(w∣α,β) p(\theta,z|w,\alpha,\beta)=\frac{p(\th...
2018-12-14 22:03:27 921
原创 cs224n词向量表示word2vec
cs224n词向量表示word2vecWord2vecSkip-gram predictiongradient Word2vec word2vec模型的核心是构建一个简单、可扩展的快速训练模型。利用语义理论来预测每个单词和它的上下文的词汇 两个算法: Skip-grams (SG):预测上下文 Continuous Bag of Words (CBOW):预测目标单词 两种稍微高效一些的训练方法:...
2018-12-02 19:23:57 692
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人