爬虫#爬短视频并下载

爬虫# 爬短视频并下载

  1. 分析网站
    浏览器网站过程;浏览器请求视频服务器然后视频服务器反馈视频数据
    爬虫过程;找到请求(模拟浏览器发送请求)网址(可以根据preview确定),在preview里找到反馈数据,再从里面提取视频播放地址和视频的名称,后面根据视频播放地址保存到本地。
  2. 发送请求
    ①发送请求;
    import requests
    url=‘地址’
    ②模拟浏览器;
    请求头
    header={user-agent…(浏览器信息)}
    r=requests.get(url,headers=header).json()
    #Response[200]响应的状态码~200代表请求成功,print(“r”)
    ③获取数据(注意获取层次)
    videos=r[‘最高层’][‘中间层’][‘最底层’]
    #print(‘videos’)
    取里面元素需要循环
    for index in videos # print(index)
    ④获去视频名字和播放地址
    title=index[‘title’]#名称
    paly_url=index[‘play_url’]#播放地址
  3. 保存视频
    根据视频地址保存本地
    再发一次请求(往视频播放地址)
    video_content=requests.get(play_url,headers=header)
    获取内容
    video_content=requests.get(play_url,headers=header)
    .content
    保存视频
    path=‘路径\’ #保存路径,\是转译的意思
    with open(path+title+’.mp4’,‘wb’)as f:
    f.write(video_content)
    #wb的意思w是写,b是二进制
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值