python3爬虫获取视频_Python3 + requests 爬取B站视频实例

本文提供了一个简洁的Python代码示例,使用requests库抓取B站视频网页源码,并通过正则表达式提取视频链接。之后,利用you-get工具将视频下载到本地。关键步骤包括用户输入视频关键字、设置爬取页数、循环抓取和下载视频。
摘要由CSDN通过智能技术生成

本文将使用requests库,用requests爬取B站视频的思路如下:

使用requests库将页面源码扒下来

把所有视频链接地址从源码扒下来

使用you-get下载视频到本地

需要注意的地方在第二步,使用的正则表达式,在提取视频链接地址的时候,

直接只提取我们需要的部分(问号前面的部分)。

完整代码如下,可以发现一共就12行,因为我把那些花里胡哨的代码都给移除,

只留下核心的部分,方便同学参考:

# coding=utf-8

import requests,os,re

search_name = input('您想要爬取的视频关键字是?\n(输入完毕请按回车):')

pages = 51 #设置爬取的总页数

video_path = r'D:\Video'#视频保存路径

for page in range(1,pages):#翻页循环

r = requests.get(url)#GET请求访问网页

content = r.text#解析网页源码

links = re.findall(r'www.bilibili.com/video/av\d+',content)#使用正则表达式从源码中找到所有视频地址

for link in links:#循环下载所有链接

os.system('you-get -o %s %s' % (video_path,link))#调用you-get方法挨个下载该次循环的所有视频

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值