中文分词

在网上找了n天的关于中文分词的文章,发现一些有用的资源:

1、计算所汉语词法分析系统 ictclas 提供源代码C++的,不过好象编译之后和作者提供的程序分词结果有出入,源代码研究中。

2、猎兔推出的ictclas 的 .net版本 http://www.lietu.com/doc/LuceneDotNetSeg.htm 试用版,可以反编译,有同样问题,分词的结果不是很理想。

3、www.rainsts.net 提供的分词组件 ,采用c#.net 编写 分词结果还可以,不过不提供V2版下载 ,V1版字典无法扩充,由于使用混淆器,反编译失败,暂时选择这个组件使用。

4、还有其他一些作者写的分词的代码,和商业使用的模块,由于没有实验,不知道效率和准确性如何,这里不做描述。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值