selenium+python处理广告弹窗

selenium+python实现1688网站验证码图片的截取1. 背景在使用浏览器渲染技术爬取网站信息时,经常会遇到一些弹出框(广告,警告框,验证码,登录窗口等)的干扰。一般来说,当这些窗口弹出时,就无法操作原始页面。不同的弹出框有不同的处理方案: 广告:直接关闭警告框:点击确定或者取消验证码:输入验证码,进行验证登录窗口:进行登录。下面以1688网站为例,记录几种类型的处理方式。 2
摘要由CSDN通过智能技术生成

selenium+python处理广告弹窗

1. 背景

在使用浏览器渲染技术爬取网站信息时,经常会遇到一些弹出框(广告,警告框,验证码,登录窗口等)的干扰。一般来说,当这些窗口弹出时,就无法操作原始页面。

  • 不同的弹出框有不同的处理方案:
    • 广告:直接关闭
    • 警告框:点击确定或者取消
    • 验证码:输入验证码,进行验证
    • 登录窗口:进行登录。

下面以1688网站为例,记录几种类型的处理方式。

2. 环境

  • python 3.6.1
  • 系统:win7
  • IDE:pycharm
  • 安装过chrome浏览器
  • 配置好chromedriver
  • selenium 3.7.0

3. 广告弹窗的处理

这里写图片描述
这里写图片描述

3.1. 分析广告弹窗的源码

这里写图片描述

<div class="s-overlay-box">
 <div class="s-overlay-widget">
<div class="s-widget-overlaycontent" data-cookie-key="__sw_newuno_count__" data-top-sect="newUserNoDiamond">
 <div class="s-overlay-widget-body">
 <img src="//cbu01.alicdn.com/cms/upload/2017/612/899/2998216_1921578814.png">
 </div>
 <div class="s-overlay-widget-foot">
 <div class="s-overlay-widget-ic">开始找货</div>
 </div>
</div>

   </div>
 <div class="s-overlay-close">
 <i></i>
 <em class="s-overlay-close-t"></em>
 <em class="s-overlay-close-r"></em>
 <em class="s-overlay-close-b"></em>
 <em class="s-overlay-close-l"></em>
 </div>
 </div>

这里写图片描述

<div class="home-identity-dialog"> <span class="identity-close"> <i class="identity-icon identity-close-icon"></i> </span> <div class=
  • 4
    点赞
  • 50
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
Selenium是一个用于自动化浏览器操作的工具,而Python是一种流行的编程语言。如果你想使用Selenium来进行Python编程,你可以通过安装Selenium库,并结合Python代码来实现自动化浏览器操作。 你可以通过以下步骤来开始使用SeleniumPython: 1. 安装Python:首先,确保你已经安装了Python。你可以从官方网站https://www.python.org/downloads/下载并安装最新版本的Python。 2. 安装Selenium库:打开命令行终端(或者使用Anaconda Prompt),运行以下命令安装Selenium库: ```shell pip install selenium ``` 3. 下载并安装浏览器驱动程序:Selenium需要与特定的浏览器驱动程序配合使用。你需要根据你使用的浏览器类型,下载并安装相应的浏览器驱动程序。比如,如果你使用的是Chrome浏览器,可以从ChromeDriver官方网站https://sites.google.com/a/chromium.org/chromedriver/下载对应版本的ChromeDriver。 4. 编写Python代码:使用任何文本编辑器创建一个Python脚本,并导入Selenium库。然后,你可以通过编写代码来控制浏览器。下面是一个简单的示例,展示如何使用SeleniumPython打开一个网页: ```python from selenium import webdriver # 创建浏览器驱动对象 driver = webdriver.Chrome('path/to/chromedriver') # 打开网页 driver.get('https://www.example.com') # 进行其他操作,比如查找元素、填写表单等 # 关闭浏览器 driver.quit() ``` 请注意,你需要将`path/to/chromedriver`替换为你自己的ChromeDriver驱动程序的路径。 这只是SeleniumPython的基本用法示例,你可以根据自己的需求进行更多的操作和控制。希望对你有所帮助!如有任何问题,请随时询问。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值