爬取指定网站的电影，默认url已获得。代码经测试可用

最新推荐文章于 2022-06-21 18:08:03 发布

weixin_44418748

最新推荐文章于 2022-06-21 18:08:03 发布

阅读量1.4k

点赞数

文章标签： Python

本文链接：https://blog.csdn.net/weixin_44418748/article/details/102539337

版权

python爬取电影测试可用

爬取指定网站的电影，默认url已获得
视频地址存于文件中。用python 直接读取下载

爬取指定网站的电影，默认url已获得

网站电影文件是以 .ts 流的形式，顺序增加的。

import requests

def temp(i):
    ##    1找到url
    url ="https://bobo.okokbo.com/20171117/2Eknv6hZ/6583kb/hls/yoCGHLE"+ i +".ts"
    headers ={"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11"}  
    ##    2解析url
    r = requests.get(url,headers =headers)
    ##    3提取数据
    ret =r.content  #这个url的二进制数据
    ##    4保存数据
    with open('./mp4/{}'.format(url[-10:]),'wb') as f:
        f.write(ret)
        
for i in range(63116000,63117000):# 根据实际情况更改
    temp(str(i))

# copy /b *.* new.mp4 最后整理的时候合并成1个文件

视频地址存于文件中。用python 直接读取下载

在【实战】利用python爬虫爬取中国大学慕课课程视频及文件https://blog.csdn.net/qq_37244001/article/details/84780430
中的 main.py 生成的文件 links.txt 里边存了视频地址。
以下代码为批量下载视频。

import requests

fi =open("links.txt",'r')
for line in fi:
    url = line.strip()
    print(url[-51:] + " 开始下载，请稍后... ...")
    
    
    ##    1找到url
    #url ="http://v.stu.126.net/mooc-video/nos/mp4/2017/02/28/1005853348_f171329df9a543528f1d3661025dafb4_shd.mp4"
    headers ={"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11"}  
    ##    2解析url
    r = requests.get(url,headers =headers)
    ##    3提取数据
    ret =r.content  #这个url的二进制数据
    ##    4保存数据
    with open('./mp4/{}'.format(url[-51:]),'wb') as f:
        f.write(ret)

    print(" 下载完成")
fi.close()