利用python做微信公众号标题的词云图

最新推荐文章于 2023-02-20 19:36:31 发布

pamelaaaaa

最新推荐文章于 2023-02-20 19:36:31 发布

阅读量704

点赞数

分类专栏： python大作业文章标签： python 数据可视化

本文链接：https://blog.csdn.net/pamelaaaaa/article/details/113776215

版权

一、标题数据的获取

1.通过微信公众平台后台网页，左侧的统计模块来下载相应的数据，单独把标题复制出来，形成文件形式；
2.通过网页爬虫来爬取。

二、词云图制作过程

1.引入需要的库

import wordcloud
import jieba

2.读取文件并查看文件

#读取文件
wf = open("title.txt","r",encoding='utf8').read()
print(wf)

3.利用jieba分词

cut_text = jieba.lcut(wf,cut_all=False)
result = ' '.join(cut_text) #转为字符串
print(result)

#获取停用词表，注意词云图的结果不想有单字的情况，需要使用该表，但是这个文件表要排除的字并不完善，可以根据自己的结果往里面加字，记得保存即可
stop = open('stopwords.t