- 博客(1)
- 资源 (1)
- 收藏
- 关注
原创 自然语言处理入门(8)——TextRank
TextRank是自然语言处理领域一种比较常见的关键词提取算法,可用于提取关键词、短语和自动生成文本摘要。TextRank是由PageRank算法改进过来的,所以有大量借鉴PageRank的思想,其处理文本数据的过程主要包括以下几个步骤:(1)首先,将原文本拆分为句子,在每个句子中过滤掉停用词(可以不选),并只保留指定词性的单词,由此可以得到句子和单词的集合。(2)每个单词作为PageRank中的...
2018-02-09 16:27:16 8207 2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人