开源 Java 中文分词器 Ansj 作者孙健专访

孙健,Java程序员,从事检索、自然语言处理工作,分享了Ansj分词器的开发背景、难点,如交叉歧义、组合歧义和真歧义。Ansj采用全切分、N最短路径等算法,准确率为0.9848,对人名识别表现出色。在开发中,面临的主要困难是训练样本不足。Ansj在歧义处理和自定义词典添加方面有一定优势,但仍有完善空间。
摘要由CSDN通过智能技术生成
                Ansj 是一个开源的 Java 中文分词工具,基于中科院的 ictclas 中文分词算法,比其他常用的开源分词工具(如mmseg4j)的分词准确率更高。

在线演示: http://ansj.sdapp.cn/demo/seg.jsp
官网地址: http://www.ansj.org/
Github地址: https://github.com/ansjsun/ansj_seg

我们本期采访了Ansj的作者孙健,请他为大家详细介绍一下这个分词工具。

欢迎大家推荐更多开源项目给我们,支持中国的开源项目发展,如果您和您的团队希望展示创业理念和有趣之处,或者有朋友正在创造这样的价值,请联系我们,发信到blog@csdn.com即可。

先来个自我介绍吧!

 

孙建,胸无大志,没想过创业,没想过发财,只想高高兴兴写两行代码,做了近五年Java程序员&#

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值