python爬取微信中视频学术会议(m3u8->ts->mp4)

近年来,视频各行各业学术会议百花齐放,有许多会议是基于微信链接的网页的,只要用微信登录,就可以在电脑中播放。只要在电脑中能够播放,无明显加密,就可以用强大的python把视频片段按照次序下载下来,对于有价值的学术视频会议,值得下载于电脑本地,长期保存学习。

比如说,有这么一个学术会,在这里插入图片描述
把链接转发到微信助手中,在电脑网页中打开;需要扫码的,就扫码登录。
在这里插入图片描述
点击第一个视频:
在这里插入图片描述
在抓包调试中找到xhr中的m3u8文件:
在这里插入图片描述
双击下载到本地,就可以得到:
在这里插入图片描述
在这里插入图片描述
把m3u8改为“txt”,然后用txt程序打开浏览是这样:
在这里插入图片描述
用txt中的“另存为”存成utf-8格式的文本:
在这里插入图片描述
然后,就可以用python大显身手啦!
首先,用正则匹配出有效网址,具体代码为:

import requests
import re
import os


with open('ts单.txt','r',encoding='utf-8') as file:
	txt_list = file.readlines()	
txt = ''.join(txt_list)
# print(txt)

pat1 = r'(http.*?ts)'
#'
url_htmls = re.compile(pat1).findall(txt)
# print(url_htmls)
print(len(url_htmls))

with open('rename.txt','a+',encoding='utf-8') as fp:
	i = 1
	for url_html in url_htmls:
		filename = url_html.split('/')[-1].split('.')[0] + '.None'
		txt = 'rename ' + filename + ' ' + str(i).rjust(4,'0') + '.mp4'
		print(txt)
		fp.write(txt)
		fp.write('\n')
		i += 1

就得出一个rename.txt的文件,如图:
在这里插入图片描述
然后,可以把txt改成bat备用。

下面是重点代码块,请自己体会:

import requests
import re
import os
import threading
import queue
import threadpool

 
def download(i):
    try:
        print('正在多线程下载:',i)
        os.system('you-get ' + i)
    except:
        print('error ' + i)
 

with open('ts单.txt','r',encoding='utf-8') as file:
	txt_list = file.readlines()	
txt = ''.join(txt_list)
# print(txt)

pat1 = r'(http.*?ts)'
#'
url_htmls = re.compile(pat1).findall(txt)
print(url_htmls)
print(len(url_htmls))


# url_htmls = ['https:' + x for x in url_htmls]
# print(url_htmls) 

pool = threadpool.ThreadPool(7)
requests = threadpool.makeRequests(download, url_htmls)
[pool.putRequest(req) for req in requests]
pool.wait()
print('下载结束')

如此,会有用you-get方式下载的“.None”文件,如图:
在这里插入图片描述
等代码运行完毕后,就是这样:在这里插入图片描述
最后,把备好的rename.bat双击运行一下,得到大量按照顺序排列的MP4片段:
在这里插入图片描述
然后写一个bat合并命令,就行啦:
copy /b F:\DownloadApp*.mp4 F:\DownloadApp\new.mp4
在这里插入图片描述
双击hebing.bat:在这里插入图片描述
最终生成一个new.mp4视频。就是你想要的视频啦!

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

最懂编程的医生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值