Python 爬取微信聊天记录并分析聊天内容_python自动抓取微信聊天内容

使用Python程序MemoTrace从微信导出聊天记录,并通过csv格式存储,便于后续的数据分析。文章介绍了如何解决wxid获取问题,以及推荐的Python环境配置(Python3.8,numpy,pandas,seaborn,jieba,july和wordcloud)来进行内容分析和可视化。
摘要由CSDN通过智能技术生成

下载微信聊天记录爬取程序:(软件安全正常,直接无视安全问题😎)

https://github.com/LC044/WeChatMsg/releases/download/v1.0.6/MemoTrace-1.0.6.exe

电脑需要登录微信,如果电脑微信聊天记录不齐全,可以通过手机进行微信聊天记录迁移。

  • 安卓: 手机微信->我->设置->聊天->聊天记录迁移与备份->迁移-> 迁移到电脑微信(迁移完成后重启微信)
  • iOS: 手机微信->我->设置->通用->聊天记录迁移与备份->迁移-> 迁移到电脑微信(迁移完成后重启微信)

打开软件,随后点击获取信息,获取手机号、微信昵称、wxid等内容,之后点击开始启动就行。

若出现wxid或微信路径无法获取问题,查看解决办法("留痕"使用教程 (lc044.love)")),一般都是没问题的。

选择 “数据  -->  批量导出”,选择你想要导出的联系人信息。导出格式选择csv格式,方便我们后续利用python进行数据分析:

导出后的结果在程序同目录下的“data -->  聊天记录“文件中,我们需要csv文件,记住csv文件的地址,自此微信聊天记录爬取结束👌。

PS:上述软件也可以进行数据分析,作者也贴出年度报告,各位可以尝试一下,不过内容较少且存在乱码。

二、内容分析可视化展示:

环境配置:python3.8(3.10matplotlib不兼容问题) numpy pandas seaborn jieba july wordcloud

接下来直接内容分析代码,代码中需要根据你的CSV文件地址修改以及聊天双方名字修改

import matplotlib.pyplot as plt
import pandas as pd
import re
import july
import jieba

from july.utils import date_range
import seaborn as sns
from scipy.stats import norm
import numpy as np

from wordcloud import WordCloud
from collections import Counter


def set_chinese_font():
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值
>