手把手教你使用Python网络爬虫获取B站视频选集内容（附源码）

最新推荐文章于 2024-10-14 15:25:05 发布

小小程序员i549

最新推荐文章于 2024-10-14 15:25:05 发布

阅读量2.1k

点赞数 1

文章标签：爬虫 python big data

本文链接：https://blog.csdn.net/i54996/article/details/120771240

版权

本文介绍了如何使用Python的selenium库和xpath选择器抓取B站视频选集，详细讲解了实现过程并解决可能出现的谷歌驱动版本问题，适合Python爬虫初学者实践。

摘要由CSDN通过智能技术生成

一提到B站，第一印象就是视频，相信很多小伙伴和我一样，都想着去利用网络爬虫技术获取B站的视频吧，但是B站视频其实没有那么好拿到的，关于B站的视频获取，之前有介绍通过you-get库进行实现，感兴趣的小伙伴可以看这篇文章：You-Get 就是这么强势！。

言归正传，经常在B站上学习的小伙伴们可能经常会遇到有的博主连载几十个，甚至几百个视频，尤其像这种编程语言、课程、工具使用等连续的教程，就会出现选集系列，如下图所示。

当然这些选集的字段我们肉眼也是可以看得到的。只是通过程序来实现的话，可能真没有想象的那么简单。那么这篇文章的目标呢，就是通过Python网络爬虫技术，基于selenium库，实现视频选集的获取。

具体实现

这篇文章我们用的库是selenium，这个是一个用于模拟用户登录的库，虽然给人的感觉是慢，但是在网络爬虫领域，这个库还是用的蛮多的，用它来模拟登录、获取数据屡试不爽。下面是实现视频选集采集的所有代码，欢迎大家亲自动手实践。

# coding: utf-8from selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support import expected_conditions as EC<

最低0.47元/天解锁文章