python生成词云教程(附带QQ聊天记录生成词云实战)

原文链接:

python生成词云(附带QQ聊天记录生成词云实战) | 韦阳的博客

很多同学对词云很感兴趣,就是给一段文本,然后根据它的词频,生成出好看的词云,就像下面这张图一样:

v2-326148f6ab6961ed638c530dff1e1ff8_b.jpg

生成这个其实很简单,python代码我已经放在github上面了,大家下载下来就能直接用:

godweiyang/wordcloud

下面我讲讲怎么使用这个代码。

环境配置

首先需要python3环境,推荐使用Anaconda安装。

然后需要jiebawordcloud库,所以运行下面两条命令安装两个库:

pip3 install jieba

pip3 install wordcloud

文件目录

这个代码文件夹是如下结构:

  • data
    • templates:这个文件夹下放所有你词云想要的样式图片,背景色最好简单一点
    • stopwords.txt:这是停止词文件,对于你不想在词云中出现的词,你都可以添加到这个文件中过滤掉它。
  • fonts:这个文件夹下放词云中显示的字体。
  • create_word_cloud.py:这是词云的主代码。
  • preprocess.py:这是用来预处理QQ聊天记录的。

使用方法

对于一般的文本文件,直接运行python3 create_word_cloud.py filename.txt就能生成词云了,效果如下:

v2-e11cf212bdc9c394df006d277d029b43_b.jpg

生成QQ聊天记录词云

首先打开消息记录,点击下方的消息管理器:

v2-b1a8b910f21260f5de2a113a1bda8806_b.jpg

然后在需要导出的聊天对象上面右键点击导出消息记录:

v2-4a030b54123cd87d21485103638543a4_b.jpg

然后保存类型选择txt,点保存,并将文件保存在wordcloud根目录下:

v2-711f20c7be47d449c2fb99da02fada0d_b.jpg

然后打开命令行运行python3 preprocess.py filename.txt,用来去掉聊天记录中的昵称和时间等信息:

最后运行python3 create_word_cloud.py __filename.txt就能生成词云了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

算法码上来

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值