做任何一件事我们有目的才可以做到事半功倍,我们学习的时候也要带着自己想要的结果以及问题去学习,才可以让你更快的掌握一门知识。这次我主要是带大家实现通过自动化selenium模拟人工点击网站广告。以下内容均在python2.7版本环境下
涉及的知识点主要有以下几点
①selenium之模拟Chrome浏览器包含安装加使用
②selenium 操作框架和窗口
③selenium的智能等待时间
④selenium操作滚动条
⑤使用xpath进行元素定位
一。selenium之模拟Chrome浏览器包含安装加使用
Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样,这样也可以让我们不容易被网站服务器发现,其他请自行百度。
①安装selenium
如果大家安装了python的下载工具pip之后可以直接在cmd窗口使用
pip install selenium
来安装selenium包,这里有一个小技巧大家可以在任何地方使用shift+右键 打开cmd窗口执行上述命令
②安装Chrome和Chromedriver驱动
Chromedriver驱动下载地址:http://chromedriver.storage.googleapis.com/index.html
Chromedriver与Chrome对应版本可看每个版本的notes文件,一定要对应上否则会报错的
Chrome浏览器安装:https://www.google.cn/chrome/ (可能需要梯子)
Chromedriver下载后放在哪里?可以放在Chrome安装目录下:C:\Program Files (x86)\Google\Chrome\Application
from selenium import webdriver
driver = webdriver.Chrome() #使用Chrome浏览器
driver.maximize_window() #窗口最大化
二。selenium 操作框架和窗口
selenium操作框架和窗口都用的是switch_to方法,以前是switch_to_frame/switch_to_windows但这个已经被替换
这个一般在有框架的页面使用,使用方法如下:
#②也可以使用切换框架的方法进入,然后选择自己想要的
# driver.switch_to.frame("ifr2100668")
#driver.switch_to.default_content() #跳出框架
有时会点击代码后进入另一个窗口,当值如果你还停留在原来的界面的话,一直获取不到你想要的数据,这时你就要看看是不是切换了窗口,一些简单操作如下:
#①切换到点击后的新窗口,如果没有这一步始终不会定位到广告链接
for handle in driver.window_handles:
driver.switch_to.window(handle)
#②或者采用这一种方法,driver.window_handles[0]为第一个handle:
#driver.switch_to.window(driver.window_handles[1])
关于操作框架和窗口的操作可以详见python官方文档:
三。selenium的智能等待时间
智能时间等待
driver.implicitly_wait(30)
使用这个智能等待时间可以比time.sleep()更加灵活,更加智能
四。selenium操作滚动条
对于有的网站存在滚动条的话,我们可以通过如下方法来操作滚动条,从而找到一些隐藏的东西
#间断性的下拉滚动窗口
for i in range(0,10000,1000):
js = "var q=document.documentElement.scrollTop="+ str(i)
driver.execute_script(js)
time.sleep(1)
五。使用xpath进行元素定位
使用xpath进行元素定位,是在python selenium自动化中最常见的方法,这个很多大神前辈应该已经发表过这样的方法和学习教程,这里小编只给大家讲解下小白利用谷歌浏览器快速获取xpath的方法。
1.使用谷歌浏览器,按住F12找到对应的源码,然后对对应的元素进行右键,会有一个copy xpath操作,就会很容易的搞到正确的xpath,这样做效率高,正确度也很高。
六。写在最后
模拟网站广告点击的demo小编暂时放在了公众号里,日后有时间会更新到GitHub中,如有问题欢迎大家批评指正。
小编学习公众号:随手学课堂(suishouxuekt),在该公众号回复“广告”即可获取demo
小编福利公众号:随手学驿站(suishouxueyizhan),发布互联网福利资源,致力于分享最实惠的福利信息。
小编个人博客:随手学课堂