python爬取电影 测试可用
爬取指定网站的电影,默认url已获得
网站电影文件是以 .ts 流的形式,顺序增加的。
import requests
def temp(i):
## 1找到url
url ="https://bobo.okokbo.com/20171117/2Eknv6hZ/6583kb/hls/yoCGHLE"+ i +".ts"
headers ={"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11"}
## 2解析url
r = requests.get(url,headers =headers)
## 3提取数据
ret =r.content #这个url的二进制数据
## 4保存数据
with open('./mp4/{}'.format(url[-10:]),'wb') as f:
f.write(ret)
for i in range(63116000,63117000):# 根据实际情况更改
temp(str(i))
# copy /b *.* new.mp4 最后整理的时候合并成1个文件
视频地址存于文件中。用python 直接读取下载
在 【实战】利用python爬虫爬取中国大学慕课课程视频及文件https://blog.csdn.net/qq_37244001/article/details/84780430
中的 main.py 生成的文件 links.txt 里边存了视频地址。
以下代码为批量下载视频。
import requests
fi =open("links.txt",'r')
for line in fi:
url = line.strip()
print(url[-51:] + " 开始下载,请稍后... ...")
## 1找到url
#url ="http://v.stu.126.net/mooc-video/nos/mp4/2017/02/28/1005853348_f171329df9a543528f1d3661025dafb4_shd.mp4"
headers ={"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11"}
## 2解析url
r = requests.get(url,headers =headers)
## 3提取数据
ret =r.content #这个url的二进制数据
## 4保存数据
with open('./mp4/{}'.format(url[-51:]),'wb') as f:
f.write(ret)
print(" 下载完成")
fi.close()