一、标题数据的获取
1.通过微信公众平台后台网页,左侧的统计模块来下载相应的数据,单独把标题复制出来,形成文件形式;
2.通过网页爬虫来爬取。
二、词云图制作过程
1.引入需要的库
import wordcloud
import jieba
2.读取文件并查看文件
#读取文件
wf = open("title.txt","r",encoding='utf8').read()
print(wf)
3.利用jieba分词
cut_text = jieba.lcut(wf,cut_all=False)
result = ' '.join(cut_text) #转为字符串
print(result)
#获取停用词表,注意词云图的结果不想有单字的情况,需要使用该表,但是这个文件表要排除的字并不完善,可以根据自己的结果往里面加字,记得保存即可
stop = open('stopwords.t