语言处理
Belinda_YZ
这个作者很懒,什么都没留下…
展开
-
Java汉语言处理工具:HanLP初体验
最近需要用分词系统对新闻文本做一些处理,之前用了jieba做的,但jiaba识别人名、地名、各种名字的表现很差,所以要么自己写识别算法,要么换分词工具。HanLP看了下介绍,感觉挺不错的,功能能扣得上我的需求。言归正传,往下走。 HanLP HanLP是清华大学开发的,由一系列模型与算法组成的开源Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、...原创 2019-03-02 10:57:52 · 2899 阅读 · 0 评论 -
汉语言自然处理工具HanLP----感受皮毛
分词设置 segment HanLP是StandardTokenizer的包装,所以修改StandardTokenizer.SEGMENT.的设置,HanLP.segment的设置也会相应改变 结果List 可以直接输出,但Term做的真的很强大---- term.word获得分好的词 term.nature获得词性 term. 词性表 每个词的词性可以通过调用term.nature获...原创 2019-03-02 17:10:29 · 401 阅读 · 0 评论