pip下载所需库
pip install re
pip install collections
pip install numpy
pip install jieba
pip install wordcloud
pip install PIL
pip install matplotlib
但是pip默认下载很慢,超级慢,慢到死那种.
所以用清华的国内镜像源(老大的带宽也超级nb).
windows平台下,在user目录下新建 pip的文件夹
新建pip.ini文件
写入
[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
[install]
trusted-host = https://pypi.tuna.tsinghua.edu.cn
# trusted-host 此参数是为了避免麻烦,否则使用的时候可能会提示不受信任
编写代码
- 注意, 文件名不能是wordcloud.py
否则报错:
AttributeError: module 'wordcloud' has no attribute 'WordCloud'
- 读取文件时, 可能报错
UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 16: illegal multibyte sequence
解决如下
open(‘order.log’,‘r’, encoding=‘UTF-8’)或者open(‘order.log’,‘rb’)
- 注意python解释器的安装路径, 以及所需库的安装路径
#utf8
# 导入扩展库
import re # 正则表达式库
import collections # 词频统计库
import numpy as np # numpy数据处理库
import jieb