文章目录
1.前言
首先鸣谢此项目
GitHub - LC044/WeChatMsg: 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告
具体内容可以在他github或者是gitee上查看,简要来说就是一个将微信消息记录解密然后存入到数据库。此作者根据数据库进行了一系列操作,可以生成一个简要的年度报告 (但是丑丑的)。
我于此基础上增加了生成数据分析和词云生成功能,这两个功能也借鉴了一位兄弟的代码,其本人项目记录如下。
基于两位大佬,我所做的微乎其微。主要有以下几点:
- 对数据分析结果进行汉化
- 优化词云生成
2. 项目介绍
2.1 项目背景及意义
随着电子产品的普及,以及社会生活原子化程度的进一步加深。微信作为一种即时通讯工具早已家喻户晓。
微信对我们来说只是一个软件,但是重要的是其中每个对话框之后的深刻故事。
本项目旨在通过对微信记录的分析,生成属于你和Ta的年度消息报告,让你们的关系留下痕迹。
2.2 项目现状
由于涉及隐私问题,微信官方并没有推出类似功能,而其他社交媒体或生活软件早已应用这项技术多年,如:网易云年度报告等。
本项目受到已有软件启发,将此项功能进行完善。
注:本项目所有数据都在本地存储,不存在上传云端等操作,注重保护用户隐私。
2.3 项目预览
2.3.1 简要年度报告
2.3.2 消息数据分析
2.3.3 词云图
3. 项目实施
3.1 获取微信聊天记录数据
3.1.1 安装
# Python>=3.10 仅支持3.10、3.11、3.12,请勿使用其他Python版本
git clone https://github.com/LC044/WeChatMsg
cd WeChatMsg
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
3.1.2使用
具体请参考WeChatMst作者博客。
https://github.com/LC044/WeChatMsg
https://gitee.com/lc044/WeChatMsg
3.2 准备工作
3.2.1 保存csv文件
请根据WeChatMst文档生成你想分析的和Ta的聊天记录,注意保存为csv格式。
保存地址应该为xxx\WeChatMsg\data\聊天记录\xxx
。将csv文件移至项目根目录下。
3.2.2 下载代码
git clone https://gitee.com/dongshengye/wechat-msg
3.2.3 修改代码
- 修改你的csv保存路径:main.py中的path变量
- 其他部分需要灵活修改
- word后缀为词云图,每次只能根据一个xxx_content.txt文件进行修改,若要生成不同人的后缀,注意进行文件选取的修改。
- 待补充…
3.3 运行代码
-
首先下载依赖,由于依赖不多,不进行具体描述
pip install xxx
-
生成简要年度报告请参考
GitHub - LC044/WeChatMsg: 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告
-
生成数据分析结果
python main.py
-
生成词云图
python xxx_word.py
4. 总结
感谢前人种的树,日后看精力(大概率鸽了)对本项目进行更细致的更新,请关注公众号申也
或者本人giteedongshengye
。