方法:
1、统计学原来(statistics)
特点:有相应的参照指标
(a)tf-idf:反应不了词汇与内容的关系
(b)pagerank:网格模型,表现比tf-idf好
2、rule(基于规则)
特点:用机器学习的方法,基于语料的,需要有人工标注关键词的文章作为语料,用神经网络进行模型训练。(趋势)
参考:https://zhuanlan.zhihu.com/p/27889420
方法:
1、统计学原来(statistics)
特点:有相应的参照指标
(a)tf-idf:反应不了词汇与内容的关系
(b)pagerank:网格模型,表现比tf-idf好
2、rule(基于规则)
特点:用机器学习的方法,基于语料的,需要有人工标注关键词的文章作为语料,用神经网络进行模型训练。(趋势)
参考:https://zhuanlan.zhihu.com/p/27889420