python的itchat库获取微信群聊历史信息_用Python微信库itchat获得好友和群组已撤回的消息...

该博客介绍了如何使用Python的itchat库来获取微信群聊历史信息,特别是关注当消息被撤回时如何捕获并记录这些信息。通过监听NOTE消息类型,当检测到消息撤回时,程序会发送撤回消息的详细内容给文件助手,包括发送者、撤回时间、原始内容等,并可重新发送撤回的图片、文件等附件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

#coding=utf-8

importitchatfrom itchat.content importTEXTfrom itchat.content import *

importsysimporttimeimportreimportos

msg_information={}

face_bug=None #针对表情包的内容#这里的TEXT表示如果有人发送文本消息()#TEXT 文本 文本内容(文字消息)#MAP 地图 位置文本(位置分享)#CARD 名片 推荐人字典(推荐人的名片)#SHARING 分享 分享名称(分享的音乐或者文章等)#PICTURE 下载方法 图片/表情#RECORDING 语音 下载方法#ATTACHMENT 附件 下载方法#VIDEO 小视频 下载方法#FRIENDS 好友邀请 添加好友所需参数#SYSTEM 系统消息 更新内容的用户或群聊的UserName组成的列表#NOTE 通知 通知文本(消息撤回等),那么就会调用下面的方法#其中isFriendChat表示好友之间,isGroupChat表示群聊,isMapChat表示公众号

@itchat.msg_register([TEXT,PICTURE,FRIENDS,CARD,MAP,SHARING,RECORDING,ATTACHMENT,VIDEO],isFriendChat=True,isGroupChat=True)defreceive_msg(msg):globalface_bug#print("消息是:"+str(msg))

msg_time_rec = time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()) #接收消息的时间

#ActualNickName : 实际 NickName(昵称) 群消息里(msg)才有这个值

if 'ActualNickName' inmsg:

from_user= msg['ActualUserName'] #群消息的发送者,用户的唯一标识

msg_from = msg['ActualNickName']#发送者群内的昵称

friends = itchat.get_friends(update=True)#获取所有好友

for f infriends:if from_user == f['UserName']: #如果群消息是好友发的

if f['RemarkName']: #优先使用好友的备注名称,没有则使用昵称

msg_from = f['RemarkName']else:

msg_from= f['NickName']breakgroups= itchat.get_chatrooms(update=True)#获取所有的群

for g ingroups:if msg['FromUserName'] == g['UserName']:#根据群消息的FromUserName匹配是哪个群

group_name = g['NickName']

group_menbers= g['MemberCount']breakgroup_name= group_name + "(" + str(group_menbers) +")"

#否则的话是属于个人朋友的消息

else:if itchat.search_friends(userName=msg['FromUserName'])['RemarkName']:#优先使用备注名称

msg_from = itchat.search_friends(userName=msg['FromUserName'])['RemarkName']else:

msg_from= itchat.search_friends(userName=msg['FromUserName'])['NickName'] #在好友列表中查询发送信息的好友昵称

group_name = ""msg_time= msg['CreateTime'] #信息发送的时间

msg_id = msg['MsgId'] #每条信息的id

msg_content = None #储存信息的内容

msg_share_url = None #储存分享的链接,比如分享的文章和音乐

#如果发送的消息是文本或者好友推荐

if msg['Type'] == 'Text' or msg['Type'] == 'Friends':

msg_content= msg['Text']#如果发送的消息是附件、视频、图片、语音

elif msg['Type'] == "Attachment" or msg['Type'] == "Video"\or msg['Type'] == 'Picture'\or msg['Type'] == 'Recording':

msg_content= msg['FileName'] #内容就是他们的文件名

#msg_content = "F:\\weixininfo\\"+msg['FileName']

msg['Text'](str(msg_content)) #下载文件

elif msg['Type'] == 'Map': #如果消息为分享的位置信息

x, y, location =re.search("

msg_content= r"纬度->" + x.__str__() + "经度->" + y.__str__() #内容为详细的地址

else:

msg_content= r"" +locationelif msg['Type'] == 'Sharing': #如果消息为分享的音乐或者文章,详细的内容为文章的标题或者是分享的名字

msg_content = msg['Text']

msg_share_url= msg['Url'] #记录分享的url

face_bug =msg_content#将信息存储在字典中,每一个msg_id对应一条信息

time.sleep(2)

msg_information.update(

{

msg_id: {"msg_from": msg_from,"msg_time": msg_time,"msg_time_rec": msg_time_rec,"msg_type": msg["Type"],"msg_content": msg_content,"msg_share_url": msg_share_url,"group_name":group_name

}

}

)#自动删除130秒之前的消息,避免数据量太大后引起内存不足

del_info =[]for k inmsg_information:

m_time= msg_information[k]['msg_time'] #取得消息时间

if int(time.time()) - m_time > 130:

del_info.append(k)ifdel_info:for i indel_info:

msg_information.pop(i)#监听是否有消息撤回

@itchat.msg_register(NOTE,isFriendChat=True,isGroupChat=True,isMpChat=True)definformation(msg):#如果这里的msg['Content']中包含消息撤回和id,就执行下面的语句

if '撤回了一条消息' in msg['Content']:

old_msg_id= re.search("\(.*?)\", msg['Content']).group(1) #在返回的content查找撤回的消息的id

old_msg = msg_information.get(old_msg_id) #获取到消息原文,类型:字典

print(old_msg)if len(old_msg_id)<11: #如果发送的是表情包

itchat.send_file(face_bug,toUserName='filehelper')else: #发送撤回的提示给文件助手

msg_body = old_msg['group_name'] + old_msg['msg_from'] +"\n" + old_msg['msg_time_rec'] \+ "撤回了:" + "\n" + r"" + old_msg['msg_content']#如果是分享的文件被撤回了,那么就将分享的url加在msg_body中发送给文件助手

if old_msg['msg_type'] == "Sharing":

msg_body+= "\n链接是:" + old_msg.get('msg_share_url')#print(msg_body)

itchat.send_msg(msg_body, toUserName='filehelper')#将撤回消息发给文件助手

#有文件的话也要将文件发送回去

if old_msg["msg_type"] == "Picture"\or old_msg["msg_type"] == "Recording"\or old_msg["msg_type"] == "Video"\or old_msg["msg_type"] == "Attachment":

file= '@fil@%s' % (old_msg['msg_content'])

itchat.send(msg=file, toUserName='filehelper')

os.remove(old_msg['msg_content'])

msg_information.pop(old_msg_id)#删除字典旧消息

itchat.auto_login(hotReload=True,enableCmdQR=1)

itchat.run()

### 获取处理企业微信聊天记录 为了实现对企业微信聊天记录获取与处理,可以采用官方的企业微信SDK以及第三方辅助完成。下面介绍具体方法并提供相应代码示例。 #### 安装依赖包 首先安装必要的Python,包括`wechat-work-api`用于对接企业微信接口,还有常用的HTTP请求工具`requests`: ```bash pip install wechat-work-api requests ``` #### 初始化配置 设置好应用凭证信息以便后续调用API函数,通常这一步骤涉及到了解密敏感参数如CorpID、Secret等[^1]。 ```python from we_work_api import WeWorkApi corp_id = 'your_corp_id' secret = 'your_secret_key' api_client = WeWorkApi(corp_id=corp_id, secret=secret) access_token = api_client.get_access_token() print(f'Access Token: {access_token}') ``` #### 抓取群历史消息 通过指定群组ID来拉取消息列表,注意遵循每页最多返回100条记录的规定,并循环读取直到遍历全部数据[^2]。 ```python import time def fetch_chat_history(group_chat_id, start_time=None, end_time=None): all_messages = [] next_cursor = '' while True: response_data = api_client.chat_get( chatid=group_chat_id, cursor=next_cursor, latest_start=start_time, earliest_end=end_time, limit=100 # 单次查询最大数量 ) messages_batch = response_data['message'] if not messages_batch: break all_messages.extend(messages_batch) next_cursor = response_data.get('next_cursor') if not next_cursor: break time.sleep(1) # 防止频率过高被封禁 return all_messages ``` #### 数据预处理 对于抓取出的消息体,可能包含多种类型的内容(文本、图片链接等),这里仅保留纯文字部分供下一步分析使用。 ```python def filter_textual_content(message_list): textual_contents = [ msg['content'] for msg in message_list if isinstance(msg.get('content'), str)] return '\n'.join(textual_contents) text_data = filter_textual_content(all_messages) with open('./output.txt', mode='w+', encoding='utf8') as f: f.write(text_data) ``` 上述过程展示了如何利用Python脚本批量下载特定时间段内的企业微信群对话,并提取其中的文字内容保存至本地文件中待进一步加工或建模训练之用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值