分词终于有点进展啦

ICTCLAS研究了几个月,加了N个晚班之后,现在终于有点眉目啦,ICTCLAS4J有也一定的雏形了。 

用Java实现分词的第一大步,断句和分词,下一步就是词性标记了。感觉最复杂的地方就是NShortPath(N-最短路径)这里,虽然源代码里只实现了1-最短路径,但来来回回的复杂处理搞的我有点头晕眼花。好在认真分析之后,搞清楚了其中的实现过程,用Java实现起来,至少在代码是要简练的多了。但过犹不及,不知道哪个地方没有处理好,除了第一个测试用例“他说的确实在理”分词结果正确之外,其他的都不对。

看起来高兴的还有点早,明天有时间得继续调试了。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值