标签抽取 关键词抽取 文本分类
梦无痕123
开朗活泼,乐于助人,愿意多结交技术朋友,从事互联网事业
展开
-
文本标签提取算法
目前想到方法 1,现有分词系统提出关键词,比如ansj,hannlp,word等 2,基于tfidf 算权重 3,基于textrank算法,部分分词系统采取textrank 算法 4,基于语言模型,ngram 算下热度 5,基于聚类打标签,比如基于lda 6,基于语义和知识库知识对于内容分析 总结 当前主要任务是段文本如何打标签准备,还需要很多实验要验证效果原创 2016-12-14 23:07:41 · 9537 阅读 · 0 评论 -
hannlp 字段短语提取
版本1.3.3 String content = "低功耗蓝牙技术 (BLE) 已是绝大多数物联网 (IoT) 的主要通信标准。数天前,蓝牙技术联盟 (SIG) 公布了蓝牙 5 的一些信息。这是蓝牙技术联盟新产品的名称。该产品计划于 2016 年底或 2017 年初推出。 声明称 ..."; List phraseList = HanLP.extractPhrase(conte原创 2017-08-11 13:18:07 · 2375 阅读 · 0 评论