1.下载所需库
以wordcloud(示例):
pip install wordcloud -i https://pypi.tuna.tsinghua.edu.cn/simple
2.引入库
import jieba
import matplotlib.pyplot as plt
from wordcloud import WordCloud
import pandas as pd
3.打开文本
text = pd.read_csv("D:\pythonProject\爬取小说\第一章 死而复生.txt")
text = str(text).replace('\n','').replace('\u3000','').replace(' ','') #dataframe转换str
text = text.replace(',','').replace('。','').replace('“','').replace('”','').replace('?','').replace('...','').replace(':','').replace('、','')
print(text)
(可以用python本身内置open() )
4.分词
text = ' '.join(jieba.cut(text)) #利用jieba进行分词形成列表,将列表里面的词用空格分开并拼成长字符串。
5.生成词云图
# 生成对象 中文字体路径:C:\Windows\Fonts\Microsoft YaHei UI\msyh.ttc
wc = WordCloud(font_path = "C:\Windows\Fonts\Microsoft YaHei UI\msyh.ttc",width=500, height=400, mode="RGBA", background_color=None).generate(text)
# 显示词云图
plt.imshow(wc, interpolation="bilinear")
plt.axis("off")
plt.show()
6.保存文件
#保存文件
wc.to_file("E://1.png")