自然语言处理LDA入门实战（python代码）

最新推荐文章于 2024-07-12 17:15:01 发布

she_is_brilliant

最新推荐文章于 2024-07-12 17:15:01 发布

阅读量780

点赞数

文章标签：自然语言处理 python nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/she_is_brilliant/article/details/119058890

版权

这是LDA的入门学习，由五个句子组成，训练的过程也较为简单。网页来源https://aiteam.blog.csdn.net/article/details/88392606代码是自己修改过运行的，原代码没什么问题，只是在安装包时以及stopwords那里每个人的情况不同，我这里报错了，具体解决也都是百度来的。#从nltk中import停用词import nltk#nltk.download()from nltk.corpus import stopwordsfrom nltk.ste

摘要由CSDN通过智能技术生成

这是LDA的入门学习，由五个句子组成，训练的过程也较为简单。

代码的网页来源https://aiteam.blog.csdn.net/article/details/88392606

另外，在b站上找到一个视频教程，讲的很清楚，建议先看视频。网页来源https://www.bilibili.com/video/BV1rJ411g7Mz?p=171

LDA建模的步骤

1.预处理，将文档转为list to list形式，形成dictionary字典。即[[1word1,1word2,1word3],[2word1,2word2,2word3],[3word1,3word2,3word3]]的列表中有列表的格式。其中，大列表下每个小列表代表一个文档，每个文档又包含词。所以，要先进行去停用词、去标点符号、标准化、词干化等步骤。

2.形成词-文档矩阵DT/语料库，里面包含的是词和词频。也就是dictionary.doc2bow

3.使用gensim来LDA建模，需要dictionary、corpus语料库和topic数量k。

代码是自己修改过运行的，原代码没什么问题，只是在安装包时以及stopwords那里每个人的情况不同，我这里报错了，具体解决也都是百度来的。

#从nltk中import停用词
import nltk
#nltk.download()
from nltk.corpus import stopw

最低0.47元/天解锁文章

she_is_brilliant

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
自然语言处理LDA入门实战（python代码）

这是LDA的入门学习，由五个句子组成，训练的过程也较为简单。网页来源https://aiteam.blog.csdn.net/article/details/88392606代码是自己修改过运行的，原代码没什么问题，只是在安装包时以及stopwords那里每个人的情况不同，我这里报错了，具体解决也都是百度来的。#从nltk中import停用词import nltk#nltk.download()from nltk.corpus import stopwordsfrom nltk.ste
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。