利用av号爬取Bilibili视频弹幕

最新推荐文章于 2024-05-30 22:18:55 发布

coca丶丶

最新推荐文章于 2024-05-30 22:18:55 发布

阅读量1.2k

点赞数 1

分类专栏： Python

本文链接：https://blog.csdn.net/wangctes/article/details/103409320

版权

#bilibili弹幕抓取
import requests
import re
from bs4 import BeautifulSoup
import operator#排序
 
def getHTMLText(url):
    try:
        print("获取url中...")
        headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.62 Safari/537.36'}
        r = requests.get(url,headers=headers)
        print("获取url完成")
        return r.text
    except:
        print("获取Url失败")
        
def parsePage(text):
    try:
        print("解析文本...")
        keyStr = re.findall(r'upgcxcode/78/39/[\d]*',text)#B站有两种寻址方式，第二种多一些
        key = eval(keyStr[0].split('/')[3])
        print(key)
        commentUrl = 'https://api.bilibili.com/x/v1/dm/list.so?oid=' + str(key)  # 弹幕存储地址
        res=requests.get(commentUrl)
        res.encoding = 'utf-8'
        commentText=res.text
        soup = Beautiful

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

coca丶丶

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
利用av号爬取Bilibili视频弹幕

#bilibili弹幕抓取import requestsimport refrom bs4 import BeautifulSoupimport operator#排序 def getHTMLText(url): try: print("获取url中...") headers = {'User-Agent':'Mozilla/5.0 (Wind...
复制链接

扫一扫