python爬取小视频,看完身体一天不如一天!

Python现在非常火,语法简单而且功能强大,很多同学都想学Python!所以在这里给各位看官们准备了高价值Python学习视频教程及相关电子版书籍,都放在了文章结尾,欢迎前来领取!
python爬取小视频记录
学习python简单爬虫小程序,记录代码和学习过程
环境信息
python 2.7.12
分析与步骤

  1. 要分析网站信息 http://www.budejie.com/video/
  2. 查看网页不同页面的信息
    http://www.budejie.com/video/2
    http://www.budejie.com/video/3
    http://www.budejie.com/video/4
    可以知道,不同页面的URL规则,直接在后面输入数字查看跳转到不同页
  3. 分析视频内容特点
    如图:
    python爬取小视频,看完身体一天不如一天!
    查看网页代码:
    python爬取小视频,看完身体一天不如一天!
    通过这段代码,我们可以考虑分析。在python代码中用一段存放描述内容,一段存放视频所在的url
    对于每个url地址,通过urllib所提供的urlretrieve下载
  4. 具体代码实现

-- encoding:utf8 --

import re
import sys
import urllib2
import urllib
import os
reload(sys)
sys.setdefaultencoding("utf-8")
#a = 1
url_name = []
def get(pageindex):
url = 'http://www.budejie.com/video/' + str(pageindex)

var1.set('已经获取到第%s页的视频视频'%(a))

print url
html = urllib.urlopen(url).read()
url_reg = r'data-mp4="(.?)"'
url_items = re.findall(url_reg, html)
name_reg = re.compile('<div class="j-r-list-c-desc".
?<a href=".?>(.?)</a>.*?</div>', re.S)
name_items = re.findall(name_reg, html)
for i, k in zip(name_items, url_items):
url_name.append([i, k])
#传入文件名和video地址
def saveVideo(filename,videoUrl):
print 'Saving : %s ...'%filename
urllib.urlretrieve(videoUrl,'D:\video\%s.mp4'%filename)
####main exec ####
for pageindex in range(1,3):
get(pageindex)
for index,item in enumerate(url_name):
saveVideo(index,item[1])
文末福利
python爬取小视频,看完身体一天不如一天!
python爬取小视频,看完身体一天不如一天!
获取方式:加python群 839383765 即可获取!

转载于:https://blog.51cto.com/14186420/2380430

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值