爬取指定网站的电影,默认url已获得。代码经测试可用

爬取指定网站的电影,默认url已获得

网站电影文件是以 .ts 流的形式,顺序增加的。

import requests

def temp(i):
    ##    1找到url
    url ="https://bobo.okokbo.com/20171117/2Eknv6hZ/6583kb/hls/yoCGHLE"+ i +".ts"
    headers ={"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11"}  
    ##    2解析url
    r = requests.get(url,headers =headers)
    ##    3提取数据
    ret =r.content  #这个url的二进制数据
    ##    4保存数据
    with open('./mp4/{}'.format(url[-10:]),'wb') as f:
        f.write(ret)
        
for i in range(63116000,63117000):# 根据实际情况更改
    temp(str(i))

# copy /b *.* new.mp4 最后整理的时候合并成1个文件


视频地址存于文件中。用python 直接读取下载

在 【实战】利用python爬虫爬取中国大学慕课课程视频及文件https://blog.csdn.net/qq_37244001/article/details/84780430
中的 main.py 生成的文件 links.txt 里边存了视频地址。
以下代码为批量下载视频。

import requests

fi =open("links.txt",'r')
for line in fi:
    url = line.strip()
    print(url[-51:] + " 开始下载,请稍后... ...")
    
    
    ##    1找到url
    #url ="http://v.stu.126.net/mooc-video/nos/mp4/2017/02/28/1005853348_f171329df9a543528f1d3661025dafb4_shd.mp4"
    headers ={"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11"}  
    ##    2解析url
    r = requests.get(url,headers =headers)
    ##    3提取数据
    ret =r.content  #这个url的二进制数据
    ##    4保存数据
    with open('./mp4/{}'.format(url[-51:]),'wb') as f:
        f.write(ret)

    print(" 下载完成")
fi.close()


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值