Java汉语言处理工具：HanLP初体验

最新推荐文章于 2024-06-20 16:19:04 发布

Belinda_YZ

最新推荐文章于 2024-06-20 16:19:04 发布

阅读量2.8k

点赞数

分类专栏：语言处理 HanLP 文章标签： java HanLP 自然语言处理

本文链接：https://blog.csdn.net/qq_38427979/article/details/88073235

版权

这篇博客介绍了作者在Java项目中使用HanLP作为自然语言处理工具的初体验，包括HanLP的特点、安装过程以及遇到的问题和解决方法。经过初次测试，作者确认HanLP已成功安装并可用于文本处理。

摘要由CSDN通过智能技术生成

最近需要用分词系统对新闻文本做一些处理，之前用了jieba做的，但jiaba识别人名、地名、各种名字的表现很差，所以要么自己写识别算法，要么换分词工具。HanLP看了下介绍，感觉挺不错的，功能能扣得上我的需求。言归正传，往下走。

HanLP

HanLP是清华大学开发的，由一系列模型与算法组成的开源Java工具包，目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。

在提供丰富功能的同时，HanLP内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布，使用非常方便，同时自带一些语料处理工具，帮助用户训练自己的语料。（转自官网，有修改）
官网：http://hanlp.linrunsoft.com/index.html

不得不说maven真是个好东西，繁杂的配置工程，只用在pom.xml里加几行这个，就ok了，真的造福我们这种懒人。

<dependency>
    <groupId>com.hankcs</groupId>
    <artifactId>hanlp</artifactId>
    <version>portable-1.2.8</version>
</dependency>

加上以后记得要在maven build里面compile一下

如果不是maven工程，可以跟着官网文档的步

关注

专栏目录