ik分词和jieba分词哪个好_jieba分词工具能直接进行分词,为什么还要用cnn等网络再去进行训练分词,两者效果差距大吗?...

我猜

你大概是困惑于这种费力又看似无用的探索行为,觉得毫无价值。

我说,

深度分词的结果未必就比jieba好,但这是一个研究方向。

中文分词一直面临这3个大难题:

(1)歧义:同样的词有不同切法,语义差别巨大,eg.'研究生命科学' 和 '研究生命令本科生'

(2)OOV:在训练语料库中未出现的名词,难以切分正确

(3)不一致:上下文语境不同,则切词的方式会发生变化,比如 '各国有企业相继倒闭',有两种正确切法 各国 / 有 / 企业 / 相继 / 倒闭 和 各 /国有企业 / 相继 / 倒闭,需要结合语境信息。

jieba解决了这3大难题了么?

显然没有。

深度模型有希望解决么?

好像更能耐一点。

所以有人开始尝试了。

jieba已经是工程化之后的产品,好比是一辆小面的,而这些人还在从轮子开始造车,你说,有小面的做为什么还要造车,大街上一招手就能拦一辆,殊不知也许人家能造一台保时捷出来亮瞎你的眼。

最后,如果你平日用jieba就够了,那你大可以等等,总会有大神做好了深度模型再开源给你用。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值