2021SC@SDUSC注:由于课题更改,所以本篇博客仅为博主自己的论文分析记录。
附论文链接:https://pan.baidu.com/s/1vZA29DRJRZRUQfYbU6CRkw
提取码:z45i
目录
3.1Knowledge Relevance Importance
一、项目简介
1.项目名称
Inside Importance Factors of Graph-Based Keyword Extraction on Chinese Short Text
基于图的中文短文本无监督关键词抽取
2.项目描述
输入中文短文本,抽取输出文中的重要词和主题词
3.具体任务
复现论文中的方法
4.应用价值
广泛应用于文本摘要、文本分类、信息检索
5.主要方法
graph-based KE
6.数据集
NLPIR微博语料库
二、论文分析
1.INTRODUCTION
(1)先前主要方法分为监督学习和无监督学习。
监督学习:侧重训练模型的各种特征和分类算法,单词的重要性取决于特征。
无监督学习:特别是基于图的方法,侧重于单词间的关系。
(2)先前方法的不足:尽管有监督学习方法在不断探索利用更多因素的特征,但很少有无监督学习模型利用他们。
(3)我们的方法是改进的基于图的无监督方法,将单词重要性分为:自重要