ik分词和jieba分词哪个好_jieba分词工具能直接进行分词，为什么还要用cnn等网络再去进行训练分词，两者效果差距大吗？...

最新推荐文章于 2022-01-10 21:03:41 发布

BenL Xu

最新推荐文章于 2022-01-10 21:03:41 发布

阅读量235

点赞数

文章标签： ik分词和jieba分词哪个好

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_35696321/article/details/112042637

版权

我猜

你大概是困惑于这种费力又看似无用的探索行为，觉得毫无价值。

我说，

深度分词的结果未必就比jieba好，但这是一个研究方向。

中文分词一直面临这3个大难题：

(1)歧义：同样的词有不同切法，语义差别巨大，eg.'研究生命科学' 和 '研究生命令本科生'

(2)OOV：在训练语料库中未出现的名词，难以切分正确

(3)不一致：上下文语境不同，则切词的方式会发生变化，比如 '各国有企业相继倒闭'，有两种正确切法各国 / 有 / 企业 / 相继 / 倒闭和各 /国有企业 / 相继 / 倒闭，需要结合语境信息。

jieba解决了这3大难题了么？

显然没有。

深度模型有希望解决么？

好像更能耐一点。

所以有人开始尝试了。

jieba已经是工程化之后的产品，好比是一辆小面的，而这些人还在从轮子开始造车，你说，有小面的做为什么还要造车，大街上一招手就能拦一辆，殊不知也许人家能造一台保时捷出来亮瞎你的眼。

最后，如果你平日用jieba就够了，那你大可以等等，总会有大神做好了深度模型再开源给你用。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ik分词和jieba分词哪个好_jieba分词工具能直接进行分词，为什么还要用cnn等网络再去进行训练分词，两者效果差距大吗？...

我猜你大概是困惑于这种费力又看似无用的探索行为，觉得毫无价值。我说，深度分词的结果未必就比jieba好，但这是一个研究方向。中文分词一直面临这3个大难题：(1)歧义：同样的词有不同切法，语义差别巨大，eg.'研究生命科学' 和 '研究生命令本科生'(2)OOV：在训练语料库中未出现的名词，难以切分正确(3)不一致：上下文语境不同，则切词的方式会发生变化，比如 '各国有企业相继倒闭'，有两种正确切法...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。