目前想到方法
1,现有分词系统提出关键词,比如ansj,hannlp,word等
2,基于tfidf 算权重
3,基于textrank算法,部分分词系统采取textrank 算法
4,基于语言模型,ngram 算下热度
5,基于聚类打标签,比如基于lda
6,基于语义和知识库知识对于内容分析 总结
当前主要任务是段文本如何打标签准备,还需要很多实验要验证效果
目前想到方法
1,现有分词系统提出关键词,比如ansj,hannlp,word等
2,基于tfidf 算权重
3,基于textrank算法,部分分词系统采取textrank 算法
4,基于语言模型,ngram 算下热度
5,基于聚类打标签,比如基于lda
6,基于语义和知识库知识对于内容分析 总结
当前主要任务是段文本如何打标签准备,还需要很多实验要验证效果