python爬取小视频，看完身体一天不如一天！

weixin_34128839

于 2019-04-17 22:34:51 发布

阅读量2.2k

点赞数

文章标签： python

原文链接：http://blog.51cto.com/14186420/2380430

版权

Python现在非常火，语法简单而且功能强大，很多同学都想学Python！所以在这里给各位看官们准备了高价值Python学习视频教程及相关电子版书籍，都放在了文章结尾，欢迎前来领取！
python爬取小视频记录
学习python简单爬虫小程序，记录代码和学习过程
环境信息
python 2.7.12
分析与步骤

要分析网站信息 http://www.budejie.com/video/
查看网页不同页面的信息
http://www.budejie.com/video/2
http://www.budejie.com/video/3
http://www.budejie.com/video/4
可以知道，不同页面的URL规则，直接在后面输入数字查看跳转到不同页
分析视频内容特点
如图：

查看网页代码：

通过这段代码，我们可以考虑分析。在python代码中用一段存放描述内容，一段存放视频所在的url
对于每个url地址，通过urllib所提供的urlretrieve下载
具体代码实现

-- encoding:utf8 --

import re
import sys
import urllib2
import urllib
import os
reload(sys)
sys.setdefaultencoding("utf-8")
#a = 1
url_name = []
def get(pageindex):
url = 'http://www.budejie.com/video/' + str(pageindex)

var1.set('已经获取到第%s页的视频视频'%(a))

print url
html = urllib.urlopen(url).read()
url_reg = r'data-mp4="(.?)"'
url_items = re.findall(url_reg, html)
name_reg = re.compile('<div class="j-r-list-c-desc".?<a href=".?>(.?)</a>.*?</div>', re.S)
name_items = re.findall(name_reg, html)
for i, k in zip(name_items, url_items):
url_name.append([i, k])
#传入文件名和video地址
def saveVideo(filename,videoUrl):
print 'Saving : %s ...'%filename
urllib.urlretrieve(videoUrl,'D:\video\%s.mp4'%filename)
####main exec ####
for pageindex in range(1,3):
get(pageindex)
for index,item in enumerate(url_name):
saveVideo(index,item[1])
文末福利
python爬取小视频，看完身体一天不如一天！

获取方式：加python群 839383765 即可获取！

转载于:https://blog.51cto.com/14186420/2380430

weixin_34128839

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python爬取小视频，看完身体一天不如一天！

Python现在非常火，语法简单而且功能强大，很多同学都想学Python！所以在这里给各位看官们准备了高价值Python学习视频教程及相关电子版书籍，都放在了文章结尾，欢迎前来领取！python爬取小视频记录学习python简单爬虫小程序，记录代码和学习过程环境信息python 2.7.12分析与步骤要分析网站信息 http://www.budejie.com/video/查看网页不同页面的...
复制链接

扫一扫

weixin_34128839 CSDN认证博客专家 CSDN认证企业博客

码龄8年

136: 原创

-: 周排名

105万+: 总排名

135万+: 访问

: 等级

7679: 积分

6239: 粉丝

329: 获赞

19: 评论

2136: 收藏

私信

关注

热门文章

最新评论

重装系统后，硬盘分区丢失的解决办法
gfintd: 我以前丢失过2次文件，一次是全盘重新分区了，还有一次是移动硬盘突然打不开，用WishRecy都给找回了
CAD和GIS绘制图形分析
MxDraw: 梦想CAD云图（H5）与GIS结合演示网址：https://www.mxdraw3d.com/sample/vuemapbox/（请使用谷歌或Edge浏览器） 1.综合示例：人员定位与数据监控，城市3d显示效果。 2.threejs对象：四棱锥标注动画、波动光圈、飞线线、雷达扫描、径向渐变球、立体光墙、波动光墙、模型动画、拉伸模型、three图层。 3.deck图层：弧线图层、散点图层、等线值图层、线动画图层、图案填充图层、点云图层、场景图层、网格图层、模型图层、路径流动图层。 4.L7图层：光柱和路径动画、飞线线动画、蜂窝图3D、渐变柱状图、等值线图层、网格热力图。 5.互联网地图：百度矢量、百度影像、高德矢量、高德矢量,无注记版、高德影像、GeoQ普通地图、GeoQ浅色地图、GeoQ深蓝色地图、GeoQ暖色调地图、OSM地图、天地图地形、加载天地图普通地图、天地图影像。 6.控件：小地图控件、mapbox基础控件。 7.几何计算：求最近点、计算最短路径。 8.图层：背景遮罩层、自定义水印背景、热力图、栅格图像图层、天空图层。 9绘制：添加绘制控件、添加绘制信息控件、绘制椭圆、完善的绘制控件、固定模式(坐标)、捕捉模式、绘制地理空间工具。
FindWindowEx用法
佑佑1224: intpt。zero 在哪里定义的呢
如何安装discuz论坛，discuz安装步骤
weixin_40936965: 数据库配置教程
Twproject Gantt开源甘特图功能扩展
qq_40809444: 请问一下怎么自动执行，改变对应的行颜色和对应的焦点呢

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。