DrissionPage抖音评论采集

from DrissionPage import ChromiumPage
import time
import pandas as pd

# 实例化浏览器对象
dp = ChromiumPage()
# 监听数据包
dp.listen.start('comment/list/')
# 访问网站
# 抖音视频要对着视频点击右键进入详情页!!!!!!
url = input("请输入抖音视频详情页网址:")
dp.get(url)
# 创建数据表格(一定要放在循环外面,只执行一次创建table)
table = pd.DataFrame(columns=['昵称', '地区', '评论时间', '评论内容'])  # 指定数据表格的列
index = 0
xlsx_path = input("请输入要保存的excel文件路径(格式:'C:\\Users\\14233\\Desktop\\douyin.xlsx'):")
num1 = int(input("请输入爬取评论页数(若程序停止大概率是爬完了):"))+1
for page in range(1, num1):
    print("正在爬取第%d页" % page)
    # 等待数据包加载
    resp = dp.listen.wait()
    response = resp.response.body  # 字典类型
    # 获取响应数据
    list1 = response.get('comments')
    for item1 in list1:
        nickname = item1.get('user').get('nickname')
        place = item1.get('ip_label')
        text = item1.get('text')
        print("昵称:", nickname, "地区:", place, "评论:", text)
        created_time = item1.get('create_time')
        time1 = time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(created_time))
        print("评论时间:", time1)
        print("------------------------------")
        table.loc[index] = [nickname, place, time1, text]
        index += 1
        table.to_excel(xlsx_path, sheet_name='抖音视频评论', index=False)
    # 定位底部元素位置(class是点,id是*)
    next_page = dp.ele('css:.Rcc71LyU')
    # 下滑操作
    dp.scroll.to_see(next_page)

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值