论文研读-文献聚类可视化-文献聚类结果可视分析方法研究

最新推荐文章于 2024-07-13 12:59:21 发布

weixin_43413013

最新推荐文章于 2024-07-13 12:59:21 发布

阅读量4k

点赞数

分类专栏：文献聚类可视化文章标签：可视化大数据数据挖掘

本文链接：https://blog.csdn.net/weixin_43413013/article/details/115700619

版权

本文提出一个文献聚类结果可视分析框架，包含数据预处理、文本表示、文本聚类和可视化分析。通过语料结构和内容可视化，以及交互式调整，帮助用户理解和优化聚类结果。系统实现中，采用LDA和Doc2Vec等方法，通过案例分析验证了框架的有效性。

摘要由CSDN通过智能技术生成

1 论文概述

2020年10月发表在《计算机辅助设计与图形学学报》上的中科院网络中心的一篇文章，主要是探究文献聚类结果的可视分析，提出了一个完整的文献聚类结果可视分析框架。该框架包含数据预处理、文本表示、文本聚类、聚类结果可视分析各个环节, 采用语料结构可视化、语料内容可视化、文本向量维度可视化以及可视化交互对聚类结果进行解释、分析、评估、调整和优化.

1.1 摘要

问题：在信息化时代, 文献数据呈爆炸式增长. 面对海量无标签的文献数据, 无监督文本聚类能够快速、高效地对大规模数据重新组织和归纳. 然而, 影响文献聚类效果的因素是多方面的, 从数据处理到文本表示方法到聚类算法的选择, 在任意一个环节不同的选择产生的结果可能大相径庭; 且在各环节方法种类多样使得文献聚类结果难以解释和评估, 对做好文献聚类工作造成了很大困扰.

方法：为此, 提出了一个完整的文献聚类结果可视分析框架. 该框架包含数据预处理、文本表示、文本聚类、聚类结果可视分析各个环节, 采用语料结构可视化、语料内容可视化、文本向量维度可视化以及可视化交互对聚类结果进行解释、分析、评估、调整和优化.
基于该框架, 设计并实现了文献聚类结果可视分析系统, 研究了采用不同文本表示方法、不同聚类算法对聚类结果产生的影响.

评估：最后, 通过 3 个案例, 验证了该框架有效性.