文本分析
文章平均质量分 73
文本分析
思想在拧紧
行则将至
展开
-
关键词提取
简介关键词提取算法-TFIDF和Text Rank,并给出基于jieba库的实现代码原创 2022-04-22 21:32:40 · 547 阅读 · 0 评论 -
中文文本预处理
对中文文本分词、去除停用词等预处理操作原创 2022-03-04 12:25:58 · 2615 阅读 · 3 评论 -
读取word文件中的文本信息
前言:获取指定文件夹下的所有word文件的文件名及文本数据,并将其写入至xlsx文件原创 2022-03-04 12:23:44 · 3008 阅读 · 0 评论 -
结构主题模型(一)stm包工作流
对论文(`stm: An R Package for Structural Topic Models`)中stm代码的工作流进行梳理,总体结构参考论文原文,但对部分代码执行的顺序提出个人想法。因时间有限,存在未能解决的报错和问题(如选择合适的主题数、绘制时间趋势图……),论文后面的部分内容未能详细叙述,希望有朋友能提出修改有效的建议,博主将在第一时间做出反馈。最后,希望对使用STM结构主题模型的朋友们有帮助原创 2022-02-11 22:37:24 · 13976 阅读 · 47 评论 -
结构主题模型(二)复现问题及解决
简介:整理在复现论文(stm An R Package for Structural Topic Models)代码过程中的注意事项和报错信息原创 2021-11-19 21:36:12 · 5882 阅读 · 4 评论