Python爬虫——Selenium介绍和Selenium WebDriver安装

本文介绍了Selenium的基本概念,包括它的IDE和WebDriver模块,并详细阐述了在Python环境中安装selenium和对应浏览器驱动的过程。针对Firefox和Chrome的安装给出了建议。此外,文章还总结了selenium使用过程中常见的错误及其解决方案,如路径问题、忘记关闭webdriver、不匹配的能力问题以及网络错误等。
摘要由CSDN通过智能技术生成


前言:本来是打算在完成一阶段爬虫学习的时候再对此章节进行总结,但是因为在使用selenium模块的时候遇到了浏览器类型和webdriver的兼容性问题,在经过近1天的排列组合搭配后终将此问题解决,于是决定对selenium模块进行一次总结。

前置知识:

  • Python爬虫

1. selenium是什么

  • selenium中文网
  • seleniumweb自动化测试工具集,包括IDE、Grid、RC(selenium 1.0)、WebDriver(selenium 2.0)等,其中就有包括模拟用户访问浏览器对web网站进行访问的模块,而在python中可以通过调用webdriver实现。不仅仅是python,也同时支持多种编程语言。而在python中可以利用selenium中的webdriver对浏览器进行交互,从而实现浏览器爬取网页内容的过程。
  • selenium IDE 是是firefox浏览器的一个插件。提供简单的脚本录制、编辑与回放功能。如果有需要的话可以自行下载Selenium IDE
  • WebDriver 这里可以理解为一套规范,在这套规范里定义客户端脚步与浏览器交互的协议。(例如下面通过webdriver调用浏览器进行爬虫,并通过id获取html中指定元素)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值