Python中jieba库的使用

最新推荐文章于 2024-04-02 10:43:22 发布

TongXiaoM

最新推荐文章于 2024-04-02 10:43:22 发布

阅读量663

点赞数

本文链接：https://blog.csdn.net/qq_43505386/article/details/103317750

版权

本文介绍了jieba库的安装方法，包括在Windows和pyCharm中的安装步骤。接着展示了jieba的分词效果，并通过实例讲解了如何使用jieba对中文文本进行分词，统计出现频率最高的词语，例如在《三国演义》中的应用。此外，还扩展到统计英文文档中出现次数最多的单词。

摘要由CSDN通过智能技术生成

一、jieba库的安装
因为 jieba 是一个第三方库，所有需要我们在本地进行安装。

Windows 下使用命令安装：在联网状态下，在命令行下输入 pip install jieba 进行安装，安装完成后会提示安装成功

在 pyCharm 中安装：打开 settings，搜索 Project Interpreter，在右边的窗口选择 + 号，点击后在搜索框搜索 jieba，点击安装即可

二、jieba三种模式的使用

# -*- coding: utf-8 -*-
import jieba

seg_str = "好好学习，天天向上。"

print("/".join(jieba.lcut(seg_str)))    # 精简模式，返回一个列表类型的结果
print("/".join(jieba.lcut(seg_str, cut_all=True)))      # 全模式，使用 'cut_all=True' 指定 
print("/".join(jieba.lcut_for_search(seg_str)))     # 搜索引擎模式