使用slenium+chromedriver实现无敌爬虫

最新推荐文章于 2024-06-12 18:58:03 发布

搬砖的乔布梭

最新推荐文章于 2024-06-12 18:58:03 发布

阅读量2.5w

点赞数 17

分类专栏： Python爬虫完全攻略

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010986776/article/details/79266448

版权

Python爬虫完全攻略专栏收录该内容

16 篇文章 12 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

@概述

通常各大网站的后台都会有一定的反爬机制，既为了数据安全，也为了减小服务器压力
通常反爬的手段的方向，都是识别非浏览器客户端，而selenium所做的事情，恰恰是驱动真正的浏览器去执行请求和操作，只不过信号不是来源于鼠标，而是来源于selenium的API（selenium本是一个自动化的测试工具）
自然人用户能做的一切，selenium几乎都驱动浏览器取做，无论是否有界面，包括输入、点击、滑动，等等
然而到底是鼠标操作的浏览器发起的请求还是API，对于服务端来说，是没有任何差别的
所以说：做人难，做男人难，做一个后台开发的男人难上加难，让我们开始对其实施蹂躏吧

@一些掌故

早些的时候流行的组合并不是selenium+chrome浏览器驱动，而是selenium+phantomjs
phantomjs是一款没有界面的浏览器，业界称作无头浏览器（headless），由于没有界面和渲染，其运行速度要大大优于有界面的浏览器，这恰恰是爬虫喜欢的，因此红极一时
后来chrome和火狐推出了无头模式，且运行速度很流畅，phantomjs已然寿终正寝，因此我们表过不提

@开发环境的搭建（基于ubuntu）
安装selenium：sudo pip install selenium
如果没有则安装chrome浏览器（尽量更新到58以上）：

了解本专栏

超级会员免费看

搬砖的乔布梭

关注

17
点赞
踩
87

收藏

觉得还不错? 一键收藏
打赏
5
评论
使用slenium+chromedriver实现无敌爬虫

@概述通常各大网站的后台都会有一定的反爬机制，既为了数据安全，也为了减小服务器压力通常反爬的手段的方向，都是识别非浏览器客户端，而selenium所做的事情，恰恰是驱动真正的浏览器去执行请求和操作，只不过信号不是来源于鼠标，而是来源于selenium的API（selenium本是一个自动化的测试工具）自然人用户能做的一切，selenium几乎都驱动浏览器取做，无论是否有界面，包括输入、点
复制链接

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

搬砖的乔布梭 你好我是秦始皇转世，资助请从速

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。