Python中文分词jieba.lcut()函数

最新推荐文章于 2025-03-15 15:22:51 发布

刘经纬老师

最新推荐文章于 2025-03-15 15:22:51 发布

阅读量4.4w

点赞数 28

文章标签： python 中文分词开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liujingwei8610/article/details/121758179

版权

选择题

以下代码的输出结果是？

import jieba

str="中国是一个伟大的国家"

jieba.lcut(str)

选项：

A. ['中国是一个伟大的国家']

B. ['中国', '是', '一个', '伟大', '的', '国家']

C. ['中国', '国是', '一个', '伟大', '的', '国家']

D. '中国是一个伟大的国家'

问题解析

1.jieba是python中的中文分词第三方库，可以将中文的文本通过分词获得单个词语，返回类型为列表类型。

2.jieba分词共有三种模式：精确模式、全模式、搜索引擎模式。

（1）精确模式语法：jieba.lcut(字符串,cut_all=False)，默认时为cut_all=False,表示为精确模型。精确模式是把文章词语精确的分开，并且不存在冗余词语，切分后词语总词数与文章总词数相同。

（2）全模式语法：ieba.lcut(字符串,cut_all=True)，其中cut_all=True表示采用全模型进行分词。全模式会把文章中有可能的词语都扫描出来，有冗余，即在文本中从不同的角度分词，变成不同的词语。

（3）搜索引擎模式：在精确模式的基础上，对长词语再次切分。

3.在此题中，字符串为"中国是一个伟大的国家"，jieba.lcut(str)表示以精确模式切分词语，不存在冗余词语且切分后词语总词数与"中国是一个伟大的国家"词数相同，所以答案为['中国', '是', '一个', '伟大', '的', '国家']。

答案

正确答案是：B

温馨期待

期待大家提出宝贵建议，互相交流，收获更大。

欢迎大家转发，一起传播知识和正能量，帮助到更多人。期待大家提出宝贵改进建议，互相交流，收获更大。辛苦大家转发时注明出处(也是咱们公益编程交流群的入口网址)，刘经纬老师共享知识相关文件下载地址为：http://liujingwei.cn

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

刘经纬老师 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。