爬取视频网站

请求视频数据:

import requests
#请求网址
mp4_url='https://video.pearvideo.com/mp4/adshort/20210519/cont-1729627-15677278_adpkg-ad_hd.mp4'
#加上请求头,伪装成浏览器
headers={'user-agent':' Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
#服务器返回的数据
response=requests.get(mp4_url,headers=headers)

#print(response.request)
#当出现乱码时,网页编码 请求头 服务器的连接信息
#response.encoding=response.apparent_encoding

#储存数据:手动打开关闭
#f=open('zhise.mp4',mode='wb')
#二进制数据
#f.write(response.content)
#f.close()
#print(response)

#保存数据:自动打开关闭
with open('zhese.map4',mode='wb') as f:
	   f.write(response.content)

请求网站数据:

import re
import requests

url='https://www.pearvideo.com/video_1729627'#视频详情页
res=requests.get(url)#请求网页数据

#正则表达式模板:(.*?)代表一个视频,必须以.mp4结尾,并不是url:
url=re.findall(',strUrl="(.*?)"',res.text)[0]
name_mp4=re.findall(r'<title> (.*?) </title>')
print(url)
print(name_mp4)

获取各个视频的详情页:

page_url='ttps://www.pearvideo.com/category_loading.jsp?reqType=5&categoryId=130&start=12&mrd=0.6709642884838087&filterIds=1730534,1730455,1728588,1730323,1730016,1729701,1729584,1729511,1729330,1729270,1728966,1729203'

response=requests.get(page_url)
pring(response.text)

综上:

import re
import requests
#请求网页数据
url='https://www.pearvideo.com/video_1729627'
res=requests.get(url)

#正则表达式模板:(.*?)代表一个视频,必须以.mp4结尾,并不是url:
mp4_url=re.findall(',strUrl="(.*?)"',res.text)[0]
#加上请求头,伪装成浏览器
headers={'user-agent':' Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) 
#把name.mp4:(.*?)代表视频的title
name_mp4=re.findall(r'<title> (.*?) </title>')
#请求服务器返回数据
response=requests.get(mp4_url,headers=headers) 

#保存数据:自动关闭文件
with open('视频保存名.mp4',mode='wb') as f:
	   f.write(response.content)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

夏末初涼い

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值