jieba分词

最新推荐文章于 2022-04-07 20:34:11 发布

蔡文彬

最新推荐文章于 2022-04-07 20:34:11 发布

阅读量322

点赞数

分类专栏：数据分析文章标签： jieba 分词

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37786775/article/details/81094405

版权

数据分析专栏收录该内容

4 篇文章 0 订阅

订阅专栏

pip install jieba 或者
github链接：[https://github.com/fxsjy/jieba](https://github.com/fxsjy/jieba)
利用jieba,pandas等进行数据分析https://www.jianshu.com/p/c77dab17fbd4

精确模式：试图将句子最精确地切开，适合文本分析；
全模式：把句子中所有的可以成词的词语都扫描出来, 速度非常快，但是不能解决歧义；
搜索引擎模式：在精确模式的基础上，对长词再次切分，提高召回率，适合用于搜索引擎分词。

#全模式
test1 = jieba.cut("小明硕士毕业于中国科学院计算所，后在日本京都大学深造", cut_all=True)
print("全模式: " + "| ".join(test1))

#精确模式
test2 = jieba.cut("小明硕士毕业于中国科学院计算所，后在日本京都大学深造", cut_all=False)
print("精确模式: " + "| ".join(test2))

#搜索引擎模式
test3= jieba.cut_for_search("小明硕士毕业于中国科学院计算所，后在日本京都大学深造")
print("搜索引擎模式:" + "| ".join(test3))

全模式: 小| 明| 硕士| 毕业| 于| 中国| 中国科学院| 科学| 科学院| 学院| 计算| 计算所| | | 后| 在| 日本| 日本京都大学| 京都| 京都大学| 大学| 深造

精确模式: 小明| 硕士| 毕业| 于| 中国科学院| 计算所| ，| 后| 在| 日本京都大学| 深造

搜索引擎模式:小明| 硕士| 毕业| 于| 中国| 科学| 学院| 科学院| 中国科学院| 计算| 计算所| ，| 后| 在| 日本| 京都| 大学| 日本京都大学| 深造

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
jieba分词

pip install jieba 或者github链接：[https://github.com/fxsjy/jieba](https://github.com/fxsjy/jieba)利用jieba,pandas等进行数据分析https://www.jianshu.com/p/c77dab17fbd4精确模式：试图将句子最精确地切开，适合文本分析；全模式：把句子中所有的可以成词的词语都...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。