'''
通过解析网获取电影
通过操作发现在 network 控制台中
文件名 .ts 结尾的文件为 视频文件(也就是电影某个小片段)
需要将这些全部获取下来
发现这个后缀的变化规律 .ts 后数字的变化
先拿当中的一个 ts 文件中的 url 来下载测试
发现命名为 .ts 的格式时也是可以进行播放的
为节省下载时间 了解一个新的知识点 进程池(内部需要创建多个来达到效果)
在同一个时间内 有多个任务 同时执行
=======
拼接 url 时新的知识点
%03d:001 至千 0100
=======
总的来说,获取的结果视频长度,与 正常播放的视频长度 有很大区别
如果以这种方式来观看,可能会遗漏一些重要情节
这个学习一下方法就好了
'''
import requests
from multiprocessing import Pool
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'
}
def main(a):
url = 'https://youku.cdn7-okzy.com/20200209/17080_3140a26e/1000k/hls/8a848a6cc4f000%03d.ts'%a
print(url)
response = requests.get(url,headers=headers)
print(response.status_code)
path = r'C:\Users\DELL\Desktop\python_wd\电影\{}'.format(url[-10:])
with open(path,'wb')as f:
f.write(response.content)
if __name__ == '__main__': # 程序代码入口
pool = Pool(30) # 创建了一个进程池 ,可以同时执行 30 个任务
for a in range(0,1602):
pool.apply_async(main,(a,)) # 执行任务入口
pool.close()
pool.join() # 守护进程
# 进行拼接短
# cmd 进入当前文件夹中
# 输入 dir 显示当前文件里的详情(检查)
# copy /b *.ts new.mp4(拼接命令)
解析网电影信息获取
最新推荐文章于 2023-03-18 00:00:27 发布