写在前面的话
昨天说到,之后一阵子,打算把selenium的知识进行一个复习和系统的总结。要说明以下几点:
- 因为是系统的总结,所以文章具备连贯性,但我尽量将较为集中的知识点整理在一起发
- 由浅入深的知识内容,开篇肯定不会有太多的技术涉及,觉得无趣还望轻喷
- 并不是所有朋友都喜欢或都有意愿学习selenium,所以在这个系列中还是会穿插发一些其他的文章
- 毕竟文章的总结是基于python和selenium知识的,其中会涉及测试设计等方面,但不是文章重点,故不会过于详细的说明
- 这个系列会在微信公众号底部的文章分类单独开一个窗口进行集中收录,只是希望自己能坚持把这个系列的文章写完
- 欢迎催更与错误问题指正,但公众号一经发布的文章,无法修改,故对应的简书清风python会同步更新
学习selenium能做什么?
很多书籍、文章中是这么定义selenium的:
Selenium 是开源的自动化测试工具,它主要是用于Web 应用程序的自动化测试,不只局限于此,同时支持所有基于web 的管理任务自动化。
可如果要是这么介绍selenium,估计明天关注我的人80%都要弃坑了,我又不是测试、我学什么selenium。wait a moment!先别取关…
请仔细读读后半句,支持所有基于web的管理任务和自动化!
什么算基于web的任务,就只是自动化测试?非也非也,只要是通过浏览器访问的事件,都可以算在内啊!
如今,越来越多的反爬虫技术(千奇百怪的登陆验证、接口调用中的cookie验证、异步动态加载、等等…),是你没办法直接通过requests完成获取相关数据。这时候,你就可以使用selenium,模拟浏览器操作,自动化完成你的数据获取。
简单介绍selenium
公众号里面写上selenium的前世今生,你们肯定直接觉得篇幅太长懒得看了,那我简单的概括下:
- Jason Huggins 在2004年任职于ThoughtWorks时,发起了Selenium项目
- selenium存在三个版本1.0、2.0、3.0,且即将推出4.0
- Selenium 1.0 = Selenium IDE + Selenium Grid + Selenium RC
- Selenium IDE是嵌入到Firefox浏览器中的一个插件,实现简单的浏览器操作的录制与回放功能
- Selenium Grid是一种自动化的测试辅助工具,Grid通过利用现有的计算机基础设施,能加快Web-App的功能测试
- Selenium RC分为Client Libraries和Selenium Server。Client Libraries库主要用于编写测试脚本,用来控制Selenium Server的库
- Selen