利用Python爬取YouTube上的视频播放地址

原创 2015年05月12日 10:19:55

打开www.youtube.com, 随便选择一个topic(我这里选的是lion king),再过滤选择时长小于4分钟


右键查看源代码信息

红色框内的就是视频的地址,利用正则表达式,很容易的就可以输出视频地址

# coding:utf-8

import re
import urllib

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html
  
def getUrl(html):
    reg = r"(?<=a\shref=\"/watch).+?(?=\")"
    urlre = re.compile(reg)
    urllist = re.findall(urlre,html)
    format = "https://www.youtube.com/watch%s\n"
    f = open("E:\output.txt", 'a')
    for url in urllist:
        result = (format % url)
        f.write(result)
    f.close()

pages = 10
for i in range(1,pages):
    html = getHtml("https://www.youtube.com/results?search_query=lion+king&lclk=short&filters=short&page=%s" % i)
    print getUrl(html)
    i += 1

我这里是输出了10个网页的视频地址到output.txt文档中。

版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

YouTube视频爬虫简单抓取

YouTube是世界上最大的视频网站,早期公司总部位于加利福尼亚州的圣布鲁诺。在比萨店和日本餐馆,让用户下载、观看及分享影片或短片。公司于2005年2月15日注册,由华裔美籍华人陈士骏等人创立。200...

php 获取YouTube视频信息

php 获取YouTube 视频信息 YouTube的视频地址格式 https://www.youtube.com/watch?v=[VIDEO_ID] 例子:https://w...
  • fdipzone
  • fdipzone
  • 2014年07月15日 19:48
  • 25160

获取网页中的视频下载地址(利用抓包)

根据上篇文章的思路,我用了监听网卡流量的方式来改进了我的程序。速度得到了大大的提升。思路下图是我用wireshark做的实验。把请求路径中带.mp4, .flv的请求留下来,得到的就是请求的视频资源了...
  • Honkee_
  • Honkee_
  • 2016年07月17日 18:43
  • 5661

【Python爬虫】批量抓取网页上的视频

这两天决定学一下python,就找了个评价还不错的公开课看了两天,边看边敲代码,感觉python确实是一门很简单的语言,只要有点C++、C、Java或者其他语言基础,一两天完全可以入门python。当...

python_抓取网页视频

1、为何学python 编程语言方面,本科这几年一直都用C/C++,因为研究生方向与机器学习相关,所以最近大部分时间在学机器学习,看了《机器学习实战》这本书,里面的实例都是用python来写,并且目前...
  • Hpu_A
  • Hpu_A
  • 2016年06月11日 00:34
  • 1304

用python写爬虫爬取腾讯视频的评论

python用的是3.5版本,用到的模块有urllib,re,json,request,codecs在极客学院,慕课网,网易云课堂学了差不多一个月的python了,想试试自己写一个爬虫,参考了一下人家...

python爬取小视频

python爬取小视频 python简单爬虫小程序, python 2.7.12 urllib.urlretrieve

使用Python编写简单网络爬虫抓取视频下载资源

我第一次接触爬虫这东西是在今年的5月份,当时写了一个博客搜索引擎,所用到的爬虫也挺智能的,起码比电影来了这个站用到的爬虫水平高多了! 回到用Python写爬虫的话题。...

python 获取b站视频地址

使用you-get下载凉宫春日https://bangumi.bilibili.com/anime/1056时,需要批量获取下载地址。发现使用urllib.urlopen()获取的内容和浏览器的源代码...

利用htmlunit在YouTube上抓取视频连接地址

HtmlUnit是一款模拟的浏览器,它把网页中的所有元素进行封装,比如页面的封装类是HtmlPage,从而可以对网页中的所有页面元素进行访问和操作,定制化需求,很多人基于它来做爬虫的小软件,本例对Yo...
  • Alan317
  • Alan317
  • 2015年12月03日 16:21
  • 759
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:利用Python爬取YouTube上的视频播放地址
举报原因:
原因补充:

(最多只允许输入30个字)