需求
想把跟朋友的微信聊天记录做个词云
导出微信聊天记录
我的手机是iphone,用旧版的itunes备份手机全部信息
itunes链接: https://pan.baidu.com/s/1giEHdo3r7flNHP2Brt1euw 提取码: fxma
ps:备份花的时间有点多
提取文字聊天记录
备份完成后,使用工具导出微信聊天记录
工具下载网站:http://wxbackup.imxfd.com/
大神原帖:https://zhuanlan.zhihu.com/p/32511173
百度云备份:https://pan.baidu.com/s/1ST22cM485cjR-ZiGW_nlqg 提取码: fqvf
wxbackup这个工具,需要手动指定备份文件的目录,itunes默认备份路径是
C:\Users\{Username}\AppData\Roaming\Apple Computer\MobileSync\Backup
{Username}需要替换成自己的用户名称
导出的文件包含image,video,js,css等文件夹,其中文字聊天记录在js的message.js中
可以先将js文件另存为txt,然后提取出中文
with open("F:\message.txt", 'r', encoding='utf-8') as f:
content = f.read()
# 提取中文
text = [s for s in content if '\u4e00' <= str(s) <= '\u9fff']
# 拼接成字符串
_text = ""
for i in text:
_text = _text + ''.join(i)
# 写入新文件
with open("F:\_message.txt", 'w', encoding='utf-8') as f:
f.write(_text)
PS:这里比较懒,提取之后手动删掉了双方的微信昵称
生成词云
这里用到了wordcloud、jieba跟imageio,先进行安装
pip install wordcloud -i https://mirrors.aliyun.com/pypi/simple/
pip install jieba -i https://mirrors.aliyun.com/pypi/simple/
pip install imageio -i https://mirrors.aliyun.com/pypi/simple/
#coding:utf-8
import imageio
from wordcloud import WordCloud
import jieba
text_from_file_with_apath = open('F:\_message.txt', 'r', encoding='utf-8').read()
wordlist = jieba.cut(text, cut_all=True)
word_split = " ".join(wordlist)
wc = WordCloud(
background_color="whit", # 背景颜色
max_words=2000, # 显示最大词数
font_path="C:/Windows/Fonts/simfang.ttf", # 使用字体,否则生成的词云图片会显示乱码
min_font_size=15,
max_font_size=50,
width=400,
height=860,
margin=5,
mask=imageio.imread("F:/1.png") # 图幅宽度
)
wc.generate(word_split)
wc.to_file('F:/聊天词云'+".png")
1.png
效果图:
不加mask参数
添加mask参数