python如何爬取网页视频_快就完事了!10分钟用python爬取网站视频和图片

原标题:快就完事了!10分钟用python爬取网站视频和图片

话不多说,直接开讲!教你如何用Python爬虫爬取各大网站视频和图片。

85cf7c6a1ebf481795194cf14e8c97aa.jpeg

638855753

网站分析:

我们点视频按钮,可以看到的链接是:http://www.budejie.com/video/

06e3162e8993425ebcd5a4ae4efc8791.png

接着我们点开网页源码,看下面之处

16cf3d58ac184db99b835aced286269e.png

接着我们把那个下面画红线的链接点开,可以看到是个视频。

cbf1c5b9d50647fca4b18f2e26834955.png

下面我进行相似的操作点图片按钮,可以看到链接:http://www.budejie.com/pic/

b543e7b1930541ec8161c0bb955d10dc.png

接着我们点开网页源码。

836bffac639d49e2a899cfd76d69c094.png

相同操作,我们点开链接:http://mpic.spriteapp.cn/ugc/2016/07/07/577d9f0cdd67d_1.jpg

9fd6b0d6099e446fa8f512b3c81d60af.png

基本上就是这么个套路,也就用了python的两个模块 一个urllib 一个re正则

效果图:

这个是我爬下来的图片

99e9656b7d6b414d856f5dcb21151288.jpeg

这个是我爬下来的视频

fc44c323c25841efbc4588f9ab34792d.jpeg

这个是我把Linux上的视频拖一下到Windows上给大家看效果。

5baf8b47f9d24e838371b0c762d47482.jpeg

下面直接上代码!!!

爬视频的代码

#!/usr/bin/env python

# -*- coding:utf-8 -*-

importurllib,re

defgeturl:

html = urllib.urlopen("http://www.budejie.com/video/").read

reg = r'data-mp4="(.*?)"'

returnre.findall(reg,html)

forpage inrange(1,100):

fori ingeturl:

printi #i是视频的链接地址

video = urllib.urlopen(i).read

fwc = open('./video/%s'%i.split('/')[-1],'wb')

fwc.write(video)

fwc.close

爬图片的代码

# -*- coding:utf-8 -*-importurllib,redefgeturl:html = urllib.urlopen("http://www.budejie.com/pic/").readreg = r'data-original="(.*?)"'returnre.findall(reg,html)forpage inrange(1,100):fori ingeturl:printi #i是图片的链接地址video = urllib.urlopen(i).readfwc = open('./picture/%s'%i.split('/')[-1],'wb')fwc.write(video)fwc.close

声明:本文于网络整理,著作权归原作者所有,如有侵权,请联系小编删除。返回搜狐,查看更多

责任编辑:

  • 3
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值