python中jieba库的基本知识及使用（cut lcut add_word del_word ）

本文链接：https://blog.csdn.net/2301_78696436/article/details/136905393

python中jieba库的基本知识及使用（cut lcut add_word del_word ）

一、jieba库是python中的第三方库，而非标准库
二.cut方法注意点
- 1.打印对象
- 2.关于cut_all参数
三.因此我们应该把生成器中的数据保存在列表或者通过循环遍历出来：
- 1.列表方法:
- 2.循环方法：
四.lcut方法
五.add_word方法
六.del_word方法

一、jieba库是python中的第三方库，而非标准库

因此需要在设置中或者pip安装哦

// An highlighted block
pip install jieba

二.cut方法注意点

1.打印对象

在使用jieba库的cut方法时，返回的是一个可以迭代的生成器，这意味着数据是一个一个返回的不是一次性返回的，所以不可以直接print生成器哦
以下是错误代码演示：
在这里插入图片描述

import jieba
txt="没有常春树做自由自在的花"
datas=jieba.cut(txt,cut_all=False)
print(datas)

这段代码输出结果将会是是生成器的信息而非数据哦：

// An highlighted block
<generator object Tokenizer.cut at 0x021FBE60>

（具体原因：这段代码的输出结果是 <generator object Tokenizer.cut at 0x021FBE60> 是因为 jieba.cut 方法默认返回的是一个生成器对象，而不是一个包含分词结果的列表。生成器是一种特殊的迭代器，它可以在迭代过程中逐个生成元素，而不是一次性地计算所有元素，这有助于节省内存。）