爬取B站单个视频
用到的库有 os,re,requests,lxml
直接上源码!!!
“”"
1.每次爬取都是爬到了 三个文件,现在只想要合成好的MP4文件 再在上一个例子上优化
– os.remove()
2. 如果想显示文件的大小。。。。
–1,发送请求的时候,参数添加上 steam=True
“”"
import requests
import os
from lxml import etree
import re
if name == ‘main’:
# 1.确认url
url_ = input(‘请输入你想要抓取的视频页面:’)
# 2.设置用户代理,Cookie
headers_ = {
‘User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.125 Safari/537.36’,
‘Cookie’: “_uuid=1BFF5D87-BF0F-8353-99F5-C901FAA9F09096621infoc; buvid3=B63EAE5A-4EF7-41BB-9317-CF51211D0529155811infoc; rpdid=|(k||luJY|)J0J’ulmuuR|u; CURRENT_FNVAL=80; blackside_state=1; sid=9eeltw8j; DedeUserID=313196967; DedeUserI