B站評論爬蟲教程

B站評論爬蟲教程

1. 取得評論區存儲區 html 核心資訊

1.1 打開所需的bilibili網站

在这里插入图片描述

1.2 按F12

在这里插入图片描述

1.3 按Ctrl+R或F5

在这里插入图片描述

1.4 把主頁面拖動到評論區任一處

在这里插入图片描述

1.5 選擇JS

在这里插入图片描述

1.6 找到任一個 “main?callback” 文件

在这里插入图片描述

1.7 雙擊任一個 “main?callback” 文件,瀏覽 “Header” 資訊,找到並複製 “Request URL”在这里插入图片描述
1.8 取出 “type” 和 “oid” 資訊"

以上圖為例,Request URL 是
https://api.bilibili.com/x/v2/reply/main?callback=jQuery17206718600239093921_1630327593180&jsonp=jsonp&next=0&type=1&oid=332137319&mode=3&plat=1&_=1630327695746

所以 type=1, oid=332137319

2. 加載 Library

import requests
import time # Show
from bs4 import BeautifulSoup
import json
import xlsxwriter

3. 定義要用到函數

def get_html(url):
    headers 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值