近年来,视频各行各业学术会议百花齐放,有许多会议是基于微信链接的网页的,只要用微信登录,就可以在电脑中播放。只要在电脑中能够播放,无明显加密,就可以用强大的python把视频片段按照次序下载下来,对于有价值的学术视频会议,值得下载于电脑本地,长期保存学习。
比如说,有这么一个学术会,
把链接转发到微信助手中,在电脑网页中打开;需要扫码的,就扫码登录。
点击第一个视频:
在抓包调试中找到xhr中的m3u8文件:
双击下载到本地,就可以得到:
把m3u8改为“txt”,然后用txt程序打开浏览是这样:
用txt中的“另存为”存成utf-8格式的文本:
然后,就可以用python大显身手啦!
首先,用正则匹配出有效网址,具体代码为:
import requests
import re
import os
with open('ts单.txt','r',encoding='utf-8') as file:
txt_list = file.readlines()
txt = ''.join(txt_list)
# print(txt)
pat1 = r'(http.*?ts)'
#'
url_htmls = re.compile(pat1).findall(txt)
# print(url_htmls)
print(len(url_htmls))
with open('rename.txt','a+',encoding='utf-8') as fp:
i = 1
for url_html in url_htmls:
filename = url_html.split('/')[-1].split('.')[0] + '.None'
txt = 'rename ' + filename + ' ' + str(i).rjust(4,'0') + '.mp4'
print(txt)
fp.write(txt)
fp.write('\n')
i += 1
就得出一个rename.txt的文件,如图:
然后,可以把txt改成bat备用。
下面是重点代码块,请自己体会:
import requests
import re
import os
import threading
import queue
import threadpool
def download(i):
try:
print('正在多线程下载:',i)
os.system('you-get ' + i)
except:
print('error ' + i)
with open('ts单.txt','r',encoding='utf-8') as file:
txt_list = file.readlines()
txt = ''.join(txt_list)
# print(txt)
pat1 = r'(http.*?ts)'
#'
url_htmls = re.compile(pat1).findall(txt)
print(url_htmls)
print(len(url_htmls))
# url_htmls = ['https:' + x for x in url_htmls]
# print(url_htmls)
pool = threadpool.ThreadPool(7)
requests = threadpool.makeRequests(download, url_htmls)
[pool.putRequest(req) for req in requests]
pool.wait()
print('下载结束')
如此,会有用you-get方式下载的“.None”文件,如图:
等代码运行完毕后,就是这样:
最后,把备好的rename.bat双击运行一下,得到大量按照顺序排列的MP4片段:
然后写一个bat合并命令,就行啦:
copy /b F:\DownloadApp*.mp4 F:\DownloadApp\new.mp4
双击hebing.bat:
最终生成一个new.mp4视频。就是你想要的视频啦!