jieba 和Wordcloud的安装及出现Cannot unpack file xxx的问题。

最新推荐文章于 2024-05-15 09:00:00 发布

**星光*

最新推荐文章于 2024-05-15 09:00:00 发布

阅读量270

点赞数 1

分类专栏：运维环境 # 数据处理数据库

本文链接：https://blog.csdn.net/weixin_42322206/article/details/119215028

版权

数据处理同时被 3 个专栏收录

18 篇文章 0 订阅

订阅专栏

运维环境

11 篇文章 0 订阅

订阅专栏

数据库

9 篇文章 0 订阅

订阅专栏

jieba 安装与使用

一、安装 pip install jieba

二、使用

Wordcloud库安装与使用

一、安装：pip install wordcloud

二、使用

三、配置对象：

一、安装 pip install jieba

原因分析

在下载python库的时候，由于国内网络原因，python包的下载速度非常慢，查看pip 文档，只要在 pip的时候控制超时即可, 具体参数为 --default-timeout=100，后面的时间可以自己指定。

pip install --default-timeout=1000 ....

1 指定Scripts

更改路径到python安装目录下的Scripts文件夹下，输入pip install jieba，安装成功！

2 指定清华源

pip --default-timeout=100 install  -i https://pypi.tuna.tsinghua.edu.cn/simple  jieba

3 指定豆瓣源

pip --default-timeout=100 install -i https://pypi.douban.com/simple jieba

出现在windows下使用pip安装出现Cannot unpack file xxx的问题。

添加认证

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn jieba

二、使用

1.三种模式：精确模式(将词语精确切开)、全模式(将所有可能的词语切开)、搜索引擎模式(对精确切开后的词语再次切分)

2.jieba.lcut(s)——精确模式切分，返回列表类型

jieba.lcut(s,cut_all=True)——全模式切分，返回列表类型

jieba.lcut_for_search(s)——搜索引擎模式切分，返回列表类型

jieba.add_word(w)——向分词词典添加新的词语

Wordcloud库安装与使用

一、安装：pip install wordcloud

二、使用

w = wordcloud.WordCloud()代表一个文本对应的词云

w.generate(txt)——向w中加载文本txt

w.to_file(name)——将词云输出为.png或.jpg

三、配置对象：

1 默认参数：

width=200，height=400，

min_font_size=4最小字号，

max_font_size最大字号，

font_step=1，

font_path="xxx.ttc"默认为None ，

max_words最大单词数量，

stop_words排除词列表，

mask指定词云形状(需要配合imread()使用)，

background_color="white"背景颜色

import wordcloud

c = wordcloud.WordCloud()
# test = wordcloud.WordCloud(width=1000,font_path="msyh.ttc",height=700)

2.加载词云文本

c.generate("wordcloud by Python")
# test.generate(" ".join(jieba.lcut(txt)))

3.输出词云文件

c.to_file("wordcloud.png")

**星光*

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
jieba 和Wordcloud的安装及出现Cannot unpack file xxx的问题。

jieba 安装与使用目录jieba 安装与使用一、安装 pip install jieba二、使用Wordcloud库安装与使用一、安装：pip install wordcloud二、使用三、配置对象：一、安装 pip install jieba原因分析在下载python库的时候，由于国内网络原因，python包的下载速度非常慢，查看pip 文档，只要在 pip的时候控制超时即可, 具体参数为 --default-timeout=100，后面的时间可以
复制链接

扫一扫