《学术小白的学习之路 08》自然语言处理之 sklearn_LDA主题识别、pyLDAvis的主题可视化以及层次聚类
本文主要是学习参考杨秀璋老师的博客,笔记总结与记忆。原文链接文章目录书山有路勤为径,学海无涯苦作舟(行行代码要手敲)零、吃水不忘挖井人一、LDA主题识别1.1 数据读取1.2 语料分词1.3 文本转为Tfidf矩阵1.4 LDA 模型1.4.1 模型构建1.4.2 模型主题参数1.5 pyLDAvis 可视化二、文本层次聚类2.1层次聚类2.2 文本的聚类2.2.1 筛选Top1002.2.2 分词处理2.2.3相关性计算2.2.4 相似度计算2.2.5 可视化书山有路勤为径,学海无涯苦作舟(行行
复制链接