WordCloud-快速安装与应用

itl-coder.github.io

已于 2022-05-26 20:34:40 修改

阅读量956

点赞数 2

分类专栏： Python 文章标签： python pycharm tensorflow

于 2022-05-26 20:29:01 首次发布

本文链接：https://blog.csdn.net/weixin_43340420/article/details/124991894

版权

Python 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

WordCloud-安装与应用

配置pip镜像源

# 临时下载镜像
pip install 【替换为所需要安装库名称】 -i https://pypi.douban.com/simple/
# 永久设置(python版本需高于3.5+) 链接地址可替换
pip config set global.index-url https://pypi.douban.com/simple/

# 可选择如下镜像链接以提高下载速度
# 阿里云
http://mirrors.aliyun.com/pypi/simple/

# 清华大学
https://pypi.tuna.tsinghua.edu.cn/simple/

# 中国科技大学
https://pypi.mirrors.ustc.edu.cn/simple/

# 中国科学技术大学
http://pypi.mirrors.ustc.edu.cn/simple/

# 豆瓣
https://pypi.douban.com/simple/

确认安装python版本

安装版本确定,尽可能选择高版本(python3.5不支持config参数)

`wordcloud`

wordcloud

# 由于版本问题直接安装报错,可痛过如下地址下载 wheel
https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud

选择对应版本下载	下载为`python3.9`,放在需要启动的项目处

wheel

# wheel 是 Python生态系统的一个组件，它有助于使包的安装工作正常进行。它们允许更快的安装和更稳定的包分发过程。
pip install wheel

`wheel`

打开一个项目(启动时会随机启动虚拟环境或者是运行环境,安装在当前运行环境下,wordcloud将可用)

wordcloud安装
使用测试

wordcloud使用
- 词云图(原始素材图需要为png)
  
  词云分析结果

jieba

安装jieba库

pip install jieba

`jieba`库安装

jieba.cut 方法接受三个输入参数: 需要分词的字符串；cut_all参数用来控制是否采用全模式；HMM 参数用来控制是否使用 HMM 模型
jieba.cut_for_search 方法接受两个参数：需要分词的字符串；是否使用HMM 模型。该方法适合用于搜索引擎构建倒排索引的分词，粒度比较细
待分词的字符串可以是unicode 或 UTF-8 字符串、GBK 字符串。注意：不建议直接输入GBK 字符串，可能无法预料地错误解码成 UTF-8
jieba.cut 以及 jieba.cut_for_search 返回的结构都是一个可迭代的generator，可以使用 for 循环来获得分词后得到的每一个词语(unicode)，或者用
jieba.lcut 以及 jieba.lcut_for_search 直接返回list
jieba.Tokenizer(dictionary=DEFAULT_DICT) 新建自定义分词器，可用于同时使用不同词典。jieba.dt 为默认分词器，所有全局分词相关函数都是该分词器的映射。

itl-coder.github.io

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
WordCloud-快速安装与应用

WordCloud-安装与应用配置pip镜像源# 临时下载镜像pip install 【替换为所需要安装库名称】 -i https://pypi.douban.com/simple/# 永久设置(python版本需高于3.5+) 链接地址可替换pip config set global.index-url https://pypi.douban.com/simple/# 可选择如下镜像链接以提高下载速度# 阿里云http://mirrors.aliyun.com/pypi/simple
复制链接

扫一扫