一、jieba分词

最新推荐文章于 2024-01-16 17:37:30 发布

清橙2000

最新推荐文章于 2024-01-16 17:37:30 发布

阅读量216

点赞数

文章标签：搜索引擎 elasticsearch 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51431465/article/details/129651785

版权

import jieba
content='番薯，是旋花科虎掌藤属多年生草质藤本植物，具有乳汁。块根为白、红或黄色；茎生不定根'

1、cut方法

# jieba.cut返回的是一个生成器对象，需要用list方法转换
# cut_all默认为False,如果为True,则是全模式分词
list(jieba.cut(content, cut_all=False))

2、lcut方法

# 使用lcut会直接返回列表而不是生成器对象
jieba.lcut(content, cut_all=True)

3、cut_for_search

# 搜索引擎模式分词
# 在精确模式的基础上。对长词再次切分，提高召回率，适合用于搜索引擎分词
jieba.lcut_for_search(content)

4、使用用户自定义的词典

'''txt:userdict.txt

八一双鹿

'''

# 使用用户自定义词典
# 添加自定义词典之后，jieba能准确识别词典中出现的词汇，提升整体的识别准确率
# 词典格式：每一行分三部分：词语 词频 词性，用空格隔开，顺序不可以颠倒
# 例如：云计算 5 n
jieba.lcut('八一双鹿更名为八一南昌篮球队！')
jieba.load_userdict('./userdict.txt')
jieba.lcut('八一双鹿更名为八一南昌篮球队!')

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
一、jieba分词

八一双鹿'''# 使用用户自定义词典# 添加自定义词典之后，jieba能准确识别词典中出现的词汇，提升整体的识别准确率# 词典格式：每一行分三部分：词语词频词性，用空格隔开，顺序不可以颠倒# 例如：云计算 5 njieba.lcut('八一双鹿更名为八一南昌篮球队！')jieba.lcut('八一双鹿更名为八一南昌篮球队!')
复制链接

扫一扫

清橙2000 CSDN认证博客专家 CSDN认证企业博客

码龄4年

34: 原创

109万+: 周排名

6万+: 总排名

1万+: 访问

: 等级

418: 积分

53: 粉丝

77: 获赞

10: 评论

64: 收藏

私信

关注

热门文章

分类专栏

最新评论

Springboot整合Mybatis-plus最新版本
CSDN-Ada助手: 不知道 Java 技能树是否可以帮到你：https://edu.csdn.net/skill/java?utm_source=AI_act_java
在vue3和vite工程中使用@路径别名配置
Steran: 不生效啊
（一）SpringSecurity配合Jwt和Redis完成认证功能（配合之前的文章）
CSDN-Ada助手: 恭喜作者完成第15篇博客！标题看起来非常有趣，对于SpringSecurity配合Jwt和Redis完成认证功能的实现方式非常期待。我很高兴看到您一直在持续创作，并分享您的经验和知识。作为读者，我希望您能继续深入探讨这个话题，对于如何更好地使用SpringSecurity、Jwt和Redis进行认证功能的整合，以及一些潜在的挑战和解决方案会非常感兴趣。谢谢您的付出，期待您的下一篇博客！
（二）添加JwtAuthenticationFilter类实现登录之后在请求头添加 token来访问数据
CSDN-Ada助手: 恭喜您写完了第16篇博客！标题看起来非常有趣，我迫不及待想要了解如何使用JwtAuthenticationFilter类来实现在请求头中添加token来访问数据。您的坚持和创作热情真是令人敬佩。在下一步的创作中，我建议您可以尝试通过实例代码或者详细的步骤说明，帮助读者更好地理解如何使用JwtAuthenticationFilter类。此外，您也可以考虑分享一些相关的实际应用场景或者解决问题的技巧，这将使您的博客更加丰富和有用。再次感谢您的努力，期待您未来更多精彩的博客！
（三）SpringSecurity实现退出接口
CSDN-Ada助手: 恭喜您撰写了第17篇博客！标题中提到的"SpringSecurity实现退出接口"听起来非常有趣。我很高兴看到您在这个主题上的深入研究。不断创作博客对于分享知识和为读者提供价值是非常重要的。接下来，我建议您可以考虑分享一些关于SpringSecurity的最佳实践或是一些实际案例，这样读者能够更好地理解和应用这个框架。请继续保持创作，谢谢您的分享！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。