开始
打开浏览器, 打开bilibili, 找个视频, F12, network, response, 是这个样子的:
什么鬼???WTF???于是开始百度搜索,找到了一篇文章:传送门
于是我搜索link2:
???怎么和说好的不一样???
通过大佬的文章也推测出了弹幕网址的格式:https://comment.bilibili.com/***.xml
然后我们就找***就OK了
参考了几个视频发现了这样的现象
于是便找到了cid, 将******处替换为cid完美获取
简单案例
代码:
# coding=utf-8
import re
import requests
response = requests.get("https://comment.bilibili.com/26372437.xml")
html_str = response.content.decode()
ll = re.findall("\">(.*?)</d>", html_str)
with open("未闻花名弹幕.txt", "a", encoding="utf-8") as f:
for i in ll:
f.write(i)
f.write("\n")