NLP中文分词知识梳理

最新推荐文章于 2023-05-26 00:17:56 发布

研发之道

最新推荐文章于 2023-05-26 00:17:56 发布

阅读量590

点赞数

分类专栏：搜索推荐-机器学习文章标签：人工智能机器学习自然语言处理

未来百科AI导航：https://www.huntagi.com

本文链接：https://blog.csdn.net/lsgqjh/article/details/104198256

版权

搜索推荐-机器学习专栏收录该内容

31 篇文章 8 订阅

订阅专栏

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
NLP中文分词知识梳理

中文分词开源工具ik，jieba优缺点优点：使用开源通用语料，综合全面，但缺乏专业词汇缺点：词汇时效方面，新词不及时识别行业结论实践证明，基于统计学习的分词工具要优于基于人工规则的分词工具评测结果表明，未登录词所造成的分词精度下降至少比分词歧义大5倍以上实验结果证明，字标注统计学习方法能够大幅提高未登录词的识别率难点1清晰地界定中文词汇：如“科教兴国”切词成【科教兴国】和【科教】，【兴国】都符合...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。