自然语言处理(NLP)
文章平均质量分 96
在NLP领域的一些探索
Pluto_Ct
莫道桑榆晚
展开
-
OpenHowNet 2.0的Python应用
OpenHowNet API由清华大学自然语言处理实验室(THUNLP)开发,提供方便的义原信息查询、义原树展示、基于义原的词相似度计算等功能。查找资料时发现关于OpenHowNet的资料和代码都是对应OpenHowNet旧版本的,2021年12月发布的2.0版本接口函数与1.0有较大差别,特开此贴整合相关内容。转载 2023-02-01 13:50:39 · 1380 阅读 · 3 评论 -
2022SPSSPRO认证杯数学建模B题第二阶段方案及赛后总结:唐宋诗的定量分析与比较研究
2022年第十五届“SPSSPRO杯”数学中国数学建模网络挑战赛B题(第二阶段)『特等奖』方案及赛后总结:唐宋诗的定量分析与比较研究原创 2022-07-04 20:55:09 · 8013 阅读 · 5 评论 -
2022泰迪杯数据挖掘挑战赛C题方案及赛后总结:疫情背景下的周边游需求图谱分析
2022年第十届泰迪杯数据挖掘挑战赛C题『特等奖并获泰迪杯』方案及赛后总结:疫情背景下的周边游需求图谱分析原创 2022-06-10 11:38:50 · 7122 阅读 · 17 评论 -
作者主题模型(Author-Topic Model)的Python Gensim实现
Gensim中的主题模型包括三种,分别是LDA (Latent Dirichlet Allocation) 主题模型、加入了作者因素的作者主题模型 (Author-Topic Model, ATM) 和加入了时间因素的动态主题模型 (Dynamic Topic Models, DTM) 。作者主题模型(ATM)的输入除了分词后的文章内容,还包括作者和文章的对应关系;模型的输出为每位作者对于每个主题(主题数n可以自己设定)的倾向度。LDA主题模型在许多研究中都已广泛应用,在网上也有相当多的程序资料,但原创 2022-05-20 16:08:18 · 2555 阅读 · 14 评论