Python爬虫之selenium模拟登陆

最新推荐文章于 2024-03-16 18:42:21 发布

你的龙哥哥

最新推荐文章于 2024-03-16 18:42:21 发布

阅读量1k

点赞数

文章标签： selenium简单使用模拟浏览器 Python爬虫

本文链接：https://blog.csdn.net/oyjl19961216/article/details/82777897

版权

在我们日常的爬虫运作中会遇到各种各样的网页，比如最常见的就是静态网页，这是最容易爬取的一种网页，通过上次说到的requests就可以轻易地爬取到信息，但是，我们也会遇到一些动态网页即用ajax来完成的网页，如果还是只是单纯的使用requests就不能完成了，就需要使用selenium来模拟浏览器，等待网页加载完成之后再下载网页。但是selenium需要一个软件来使用，geckodriver，下面是GitHub 上的下载链接：https://github.com/nidexiaogege/application.git
首先进行安装，
使用的第一步：先导入相关的包

from selenium import webdriver
from selenium.webdriver.firefox.options import Options as FOptions
from selenium.webdriver.chrome.options import Options

第二步：创建对象

options = FOptions()

第三步：模拟浏览器，进行配置，其中executable_path的路径就是上面那个程序的安装路径（写自己的路径）

browser = webdriver.Firefox(executable_path='D:\pachong\geckodriver-v0.21.0-win64\geckodriver',
                            firefox_options=options)

第四步：通过get请求模拟浏览器

browser.get('http://www.baidu.com')

第五步：关闭模拟的浏览器

browser.close()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

你的龙哥哥

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python爬虫之selenium深入解读【从入门到实战】

景天科技苑

12-29

1万+

Selenium在爬虫中占据比较重要的地位。我们在抓取一些普通网页的时候requests基本上是可以满足的. 但是, 如果遇到一些特殊的网站. 它的数据是经过加密的.但是呢, 浏览器却能够正常显示出来. 那我们通过requests抓取到的内容可能就不是我们想要的结果了. 例如,电影票房数据. 在浏览器上看的时候是正常的. 那么按照之前的逻辑. 我们只需要看看数据是通过哪个请求拿到的就可以进行模拟请求了. 但是数据找到了.结果是经过加密算法的

python爬虫使用selenium模拟登陆人人网

请大家直接把问题写在评论区或留言，不要只说一句"你好或在吗"，我会尽快回复的。

12-09

758

谷歌浏览器:chromedriver驱动资源下载地址: https://chromedriver.storage.googleapis.com/index.html 人人网是我们10多年前，在校学生一种喜闻乐见的娱乐方式，当你有中国Facebook的称号。但是最近几年已经不复当年之勇，甚至销声匿迹。博主在研究了一下它的安全登录机制之后，发现，它的消失真的是有原因的。登录方式及其不安全，而且网络安全验证都是使用明文密码传输。这也太坑了。。。在代码中将id值传入到控件中，模拟点击登陆 cl

1 条评论您还未登录，请先登录后发表或查看评论

python爬虫100例--爬虫技术--Selenium模拟登录CSDN（3）

qq_40260055的博客

09-22

246

写在前面 1、为甚麽要模拟登录？怎么说呢，现如今各大网站都需要用户登录后才可以访问到相关的信息，你不登录，它不给你机会。这就像是个门槛放在哪里，只有越过障碍，才能走上平坦大道。 2、为甚麽使用Selenium? 当然时它的可视化和自动化了，太有感觉了，自己就像上帝一样，写写代码，我的浏览器就自己动起来的，它不香嘛？话不多说了，就动起来。一、目标网站当然时小编经常逛逛的blog:小编个人主页二、工具主要是Selenium 模块，其他照旧。三、网站分析在这里小编介绍的是一种核心技术，即通

Python爬虫之selenium，有验证码模拟登录

最新发布

Tudective的博客

03-16

2773

在学习Selenium之前，通过request.get()或者.post(),很难获取网站所加载的动态数据，通过Selenium强大的自动化功能、多浏览器支持、跨平台支持等优点，让我轻松获取一些之前很难获取的数据，这次的案例也是结合之前的所学知识完成二.感兴趣的话还可以尝试以下其他的网站进行模拟自动登录，以后可以方便的进行各个软件的登录啦，Selenium真是一个强大的测试工具。

原 python 爬虫 Selenium 模拟登录获取源码

qq_41799291的博客

06-28

774

代码： # -*- coding:utf-8 -*- from selenium import webdriver from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.support.wait import WebDriverWait from selenium.webd...

Code皮皮虾的博客

06-25

6206

Selenium实现淘宝模拟登录一、准备二、代码分析一、准备话不多说，咋们先来看看淘宝登陆页面，可以看到登陆网址太长了，但其实"?"后面的可以是舍弃的，得到https://login.taobao.com/member/login.jhtml 就登陆而言页面默认是密码登录，也给我们少去了一些麻烦，目前来说只要找到使用Selenium找到账号和密码框赋值后，再点击登录按钮就可以实现淘宝模拟登录了，但事实并非如此，我们接着往下看。在我使用如下代码进行测试登陆的时候，惊奇的发现多出来了滑块验证码。区区

【Python3.6爬虫学习记录】（八）Selenium模拟登录新浪邮箱并发送邮件

子耶

08-17

1万+

Selenium很好使用，下面写了三个函数，分别用来:login_163() –> 登陆163邮箱(手动点击验证码) login_qzone() –> 登陆QQ空间（快捷登录） login_sina_post() –> 登陆新浪邮箱并发送邮件其中发送邮件部分，忙活了大半天，各种百度，总算解决。遇到不少经典问题，在后面列出。# 测试 selenium的使用 # 有些网页需要登陆才能打开 from

Python爬虫——selenium模拟京东网站登录（一）

01-20

from selenium import webdriver 2.浏览器获取驱动需要下载跟chrome浏览器相匹配的驱动driverchrome.exe，详情见：根据电脑浏览器的版本下载相应的驱动chromedriver.exe，环境变量的配置，详情见这里Window 下配置...

Python爬虫10-Selenium模拟登录

qq_45112156的博客

09-14

3242

对于采用异步加载技术的网页，有时候通过逆向工程来构造爬虫是比较困难的。想用Python获取异步加载返回的数据，可以使用Selenium模块模拟浏览器。 10.1Selenium和Phantomjs 10.1.1Selenium的概念和安装 Selenium是一个用于web应用程序测试的工具，它直接运行在浏览器中，就像真实的用户在操作一样。由于这个性质，Selenium也是一个强大的网络数据采集工具，它可以让浏览器自动加载页面，这样使用了异步加载技术的网页，也可获取其需要...

python selenium爬虫需要账号和密码登陆的网页_Python爬虫——selenium模拟京东网站登录（一）...

weixin_29258297的博客

02-09

2013

1.导入需要的库import timefrom selenium import webdriver2.浏览器获取驱动需要下载跟chrome浏览器相匹配的驱动driverchrome.exe，详情见：根据电脑浏览器的版本下载相应的驱动chromedriver.exe，环境变量的配置，详情见这里Window 下配置ChromeDriver(简单4步完成)再将driverchrome.exe复制到Ana...

pywinio::wrench:模拟键盘输入的小工具

05-14

pywinio pywinio - 基于实现的键盘输入工具, 可以用于银行安全控件的输入等。在写爬虫的时候, 使用 selenium 模拟登陆, 有时候会遇到网页加入了安全控件, 这时候selenium 是无能为力的, 所以找到了 winio 的方式模拟键盘输入. 使用用法在终端或者用程序去调用 exe 文件中的可执行文件，分别为64版本和32版本注意: 64版操作系统兼容32版, 键盘必须为ps/2接口或者笔记本键盘, 需要管理员权限运行若是64位系统, 需要使用下面命令开启测试模式 bcdedit.exe /set TESTSIGNING ON 调用格式: app.exe [keyword] [interval(mills)] keyword 表示要输入的字符 interval 表示每个字符输入间隔 (毫秒) 效果如下图所示: Licenses MIT

基于selenium模拟天眼查登录并爬取企业工商信息的python爬虫

05-04

此资源仅供学习用途，当前selenium都是基于无头模式的firefox或者chrome等浏览器进行爬虫抓取，天眼查的反爬技术算是很不错的，仅仅用于个人学习用，并不可以进行大数据的爬取技术： python selenium 爬虫模拟登陆 xpath css选择器可自己装proxy 想添加翻页功能可以参考里面的代码模板也可以加我QQ问;必须将deckodriver放在相同路径记住：自己输入账号和密码！每次输入之后都要回车！

python实战005:Selenium模拟账户登录

kevinfan的博客

01-15

2888

前面我通过python实战004:Selenium获取源码中的DOM元素跳转到了百度登录界面，接着我们就要实现模拟登录了，这里我们需要在两个input框中分别输入我们的用户名和密码。同样我们首先要做的就是获取当前input标签的DOM元素信息，按F12打开“开发者工具”窗口，用元素选择器分别点中“input”框即可定位到该标签的源码位置。这是用户名的...

python selenium网络爬虫模拟登陆

zxlove

11-10

495

from selenium import webdriver from selenium.webdriver.common.keys import Keys from selenium import webdriver driver = webdriver.Chrome() driver.get("http://登陆网站链接") try: assert u"通过网页标题，判断网

python版selenium模拟登录

之度的博客

07-19

731

代码】python版selenium模拟登录。

Python之selenium，使用webdriver模拟登录网站（含验证码）

m0_58026506的博客

06-25

3154

前段时间做了一个小项目，其中有一段需要自动获取网站后台的数据，但是这个网站没有任何提供给开发者的API，所以只能靠自己去探索。起初想着用发送请求的方式去模拟登陆，获取cookies，从而再获取网站后台数据，但是因为自己太菜了一些原因，放弃了这个方法。后来想到使用webdriver调用浏览器来模拟登陆，发现操作起来简单很多，而且可以达到同样的效果，于是便有了这篇文章。

Python爬虫教程:Selenium模拟登录

bagell的博客

12-21

9820

总结一下，使用Selenium模拟登录是一种强大而灵活的方式，可以帮助开发人员实现各种登录功能。通过使用浏览器驱动程序，访问登录页面，输入凭据并模拟点击登录按钮，我们可以轻松地模拟用户的登录行为。通过XPath等多种元素匹配方法，我们可以轻松地定位并操作网页上的元素。此外，还可以通过获取和保存Cookies保持登录状态，以便在后续的访问中保持身份识别。Python爬虫教程:入门爬取网页数据随着各大网站的反爬机制越来越强大，对于爬虫工程师来说，也是一个不小的挑战。

学了那么久Python还什么都做不了，我觉得你该试试这个方法了