还是很久之前写的爬虫,爬取某站的视频,因为某站的视频和音频是分开的,所以最后还需要合成在一起。
某站的舞蹈区大家都知道有很多的黑丝、白丝。嗯。。。都懂的,所以,下载下来被窝里偷偷看。
详细解释都在注释区
大家爬取的时候要注意延时一段时间,某站的访问量是很大。太快爬取会被封的。
import requests
from fake_useragent import UserAgent
import jsonpath
import re
import os
import time
# 请求头
headers = {
"User-Agent": UserAgent().random,
"referer": "你自己的refer"}
# 创建存放视频的文件夹
if not os.path.exists("创建的文件夹名"):
os.mkdir("创建的文件夹名")
# 更改文件路径
os.chdir(r"你想要存放的路径")
# # 视频列表页url
for i in range