python3爬虫系列21之selenium自动化登录163邮箱并读取未读邮件内容
1.前言
前面在 python3爬虫系列20之反爬需要登录的网站三种处理方式中介绍的第三种方法,使用自动化测试工具selenium 库。
他的作用呢?
之前爬虫都是使用到了一些 python 的请求库,模拟浏览器的请求之类的,这些毕竟都是人工的,
而如果让爬虫自己去打开浏览器,自己去请求我们要爬取的网站,自己去模拟登录啊搜索啊等等。
就可以借我们的selenium 来自动化了。
本来呢,
selenium 一直使用在自动化测试岗位,很多搞测试的妹纸就会玩这个,支持各种主流的浏览器,有点类似按键精灵,可以直接运行在浏览器上。
而在python爬虫以后呢,有人就发现使用selenium可以更好的躺好,让他自己C网站,省时省力,赶紧学起来。
不多bb&