学习笔记
文章平均质量分 61
cx元
这个作者很懒,什么都没留下…
展开
-
学习 | 文献通读《基于LDA的游客网络评论主题分类:以故宫为例》
基于LDA的游客网络评论主题分类:以故宫为例 基于LDA的主题发现模型; 【关注问题】 主题及情感倾向; 关键词 LDA 游客 网络评论 情感分析 故宫 【主要模块】 1.LDA主题分类,得到4个主题为最优结果; 2.建立旅游情感词典,分析情感极性。 【其他技术点】 1.LDA文本自动分类模型,能够通过隐含主题将不同文本联系起来; 2.采用Gibbs采样来估计LDA模型相应参数; 3.数据预处理: 分词和词性标注采用中科院计算所ICTCLAS分词词性标注一体化系统; 去停用词采用停用词表; 语义去重利用H原创 2022-01-18 16:56:00 · 883 阅读 · 0 评论 -
学习 | 聚类分析
一、什么是聚类分析 聚类原本是统计学的概念,现在属于机器学习中非监督学习的范畴,大多应用在数据挖掘、数据分析的领域。 从定义上讲,聚类就是针对大量数据或者样品,根据数据本身的特性研究分类方法,并遵循这个分类方法对数据进行合理的分类,最终将相似数据分为一组,也就是“同类相同、异类相异”。 二、聚类不是分类 分类是指有一个明确的划分标准,根据划分标准对对象集合进行分类; 聚类没有明确标准,需要靠算法判断数据之间的相似性,把相似的数据放在一起。 也就是说,在聚类结论出来之前,我们完全不知道每一类有什么特点,而是根原创 2022-01-16 12:21:02 · 2310 阅读 · 0 评论