抖音短视频数据抓取实战系列(八)——Mitmproxy抓取用户详细信息并入库
项目目录
1、抖音短视频数据抓取实战系列(〇)——前言
2、抖音短视频数据抓取实战系列(一)——模拟器的选择与设置
3、抖音短视频数据抓取实战系列(二)——Fiddler安装配置以及模拟器监测环境配置
4、抖音短视频数据抓取实战系列(三)——Fiddler抓取抖音用户详细信息数据
5、抖音短视频数据抓取实战系列(四)——Java解析Json文件数据并存库
6、抖音短视频数据抓取实战系列(五)——Mitmproxy的安装以及模拟器Mitmproxy证书安装
7、抖音短视频数据抓取实战系列(六)——Mitmproxy+python编写监测程序
8、抖音短视频数据抓取实战系列(七)——python连接MySQL数据库
9、抖音短视频数据抓取实战系列(八)——Mitmproxy抓取用户详细信息并入库
10、抖音短视频数据抓取实战系列(九)——自动化Appium的环境与参数配置
11、抖音短视频数据抓取实战系列(十)——获取抖音dom元素属性
12、抖音短视频数据抓取实战系列(十一)——Appium与Mitmproxy联合-自动取存抖音用户信息
13、抖音短视频数据抓取实战系列(十二)——抓取实战BUG总集
1、首先,我们对抓取到的数据进行分析,保存我们所需要的数据。
2、对之前的监测程序进行优化完整,加入数据库新增操作,详细代码如下:
import json
import pymysql
#函数名必须这样写 这是mitmdump规则
def response(flow):
#下面这个网址是通过fiddler获取到的 但是有些数据我们无法解密,所以需要用mitmdump捕获数据包然后做分析\
if 'aweme.snssdk.com/aweme/v1/user/profile/other/?' in flow.request.url:
result=json.loads(flow.response.text)['user']
print(" ")
print(" ")
print(" ")
print(" ")
print(" ")
print("******************************************************************************")
print(" ")
user_info= {}
if "nickname" in result:
user_info["nickname"]=result["nickname"]
else:
user_info["nickname"]="伞梦"
if "signature" in result:
user_info["signature"]=result["signature"]
else:
user_info["signature"]="大家好。"
if "uid" in result:
user_info["uid"]=result["uid"]
else:
user_info["uid"]="-1"
db = pymysql.connect("localhost", "root", "1234", "database", charset='utf8mb4')
# 使用cursor()方法获取操作游标
cursor = db.cursor()
# SQL 插入语句
sql = """INSERT INTO usertest(nickname,
uid, signature)
VALUES ('{0}', '{1}','{2}')""".format(user_info['nickname'], user_info['uid'],user_info['signature'])
#user_info['nickname'], user_info['uid'],user_info['signature']
try:
# 执行sql语句
cursor.execute(sql)
print(sql)
print("success")
# 提交到数据库执行
db.commit()
except Exception as e:
print("error")
# Rollback in case there is any error
print(e)
db.rollback()
# 关闭数据库连接
db.close()
#有的用户修改了抖音号
print(user_info)
print(" ")
print("******************************************************************************")
print(" ")
print(" ")
print(" ")
print(" ")
print(" ")
4、mitmdump -p 8900 --set block_global=false -s re.py执行程序,并进入用户主页对用户信息进行抓取,在存入数据库,如下图所示执行成功。
5、操作完成之后查看数据库,查看数据是否成功存储,如图存储成功。
项目目录
1、抖音短视频数据抓取实战系列(〇)——前言
2、抖音短视频数据抓取实战系列(一)——模拟器的选择与设置
3、抖音短视频数据抓取实战系列(二)——Fiddler安装配置以及模拟器监测环境配置
4、抖音短视频数据抓取实战系列(三)——Fiddler抓取抖音用户详细信息数据
5、抖音短视频数据抓取实战系列(四)——Java解析Json文件数据并存库
6、抖音短视频数据抓取实战系列(五)——Mitmproxy的安装以及模拟器Mitmproxy证书安装
7、抖音短视频数据抓取实战系列(六)——Mitmproxy+python编写监测程序
8、抖音短视频数据抓取实战系列(七)——python连接MySQL数据库
9、抖音短视频数据抓取实战系列(八)——Mitmproxy抓取用户详细信息并入库
10、抖音短视频数据抓取实战系列(九)——自动化Appium的环境与参数配置
11、抖音短视频数据抓取实战系列(十)——获取抖音dom元素属性
12、抖音短视频数据抓取实战系列(十一)——Appium与Mitmproxy联合-自动取存抖音用户信息
13、抖音短视频数据抓取实战系列(十二)——抓取实战BUG总集