前言
上文提到了selenium爬取B站视频的方法,也讲了很多细节,重复的地方不再赘述。
本文将使用requests库,用requests爬取B站视频的思路如下:
- 使用requests库将页面源码扒下来
- 把所有视频链接地址从源码扒下来
- 使用you-get下载视频到本地
需要注意的地方在第二步,使用的正则表达式,在提取视频链接地址的时候,
直接只提取我们需要的部分(问号前面的部分)。
完整代码如下,可以发现一共就12行,因为我把那些花里胡哨的代码都给移除,
只留下核心的部分,方便同学参考:
# coding=utf-8
import requests,os,re
search_name = input('您想要爬取的视频关键字是?\n(输入完毕请按回车):')
pages =