本期做一个selenium详细实例,会把我在元素定位中遇到的一些阻塞和经验分享给大家。
(浏览器为Chrome)
(如果只需要最终的完整代码,请直接跳转到文章最后)
浏览器打开QQ邮箱登录网址
QQ邮箱登录地址为:https://mail.qq.com/
from selenium import webdriver
import time
zhengyi = webdriver.Chrome()
zhengyi.get('https://mail.qq.com/')
这一步没有遇到问题,至于为什么导入时间库,后面会说。
元素定位,输入QQ账号和QQ密码
手动进入QQ邮箱登录网页,按下F12打开开发者工具,点击查看元素,选择元素:
可以看到QQ账号输入框的id、name等属性,都是可以直接拿来定位的好选择。
我这里选择最通用的xpath方法来定位,id=‘u',并用send事件输入QQ账号
(也可以用zhengyi.find_element_by_id(‘u')来定位,代码更清晰,不过我个人习惯采用通用的xpath)
zhengyi.find_element_by_xpath('//*[@id="u"]').send_keys("XXXXXXXXX")
同理,QQ密码元素属性id=‘p',同样定位方法
zhengyi.find_element_by_xpath('//*[@id="p"]').send_keys("XXXXXXXX")
再同理,登录按钮元素属性id=‘login_button',这里不需要发送信息,所以选择click点击事件
zhengyi.find_element_by_xpath('//*[@id="login_button"]').click()
好的,原则上到此为止,运行pycharm应该是能够输入账号和密码,并登陆成功。
but事情没有那么简单,运行后发现,selenium报错,无法找到id为u的元素。
进过仔细观察,发现是frame嵌套页面在作怪。
我们可以这样理解,每一个网页都是一个父类的frame,从我们访问这个网址开始,就已经进入了这个父类frame嵌套。顾名思义,有父即有子。frame(父)里嵌套了iframe(子),如果我们要定位的元素在iframe里,那么我们需要先切换至iframe。
iframe也是有自己的元素属性的,selenium也提供了switch方法供我们使用
重新F12往上找iframe信息,可以看到被iframe嵌套了,id和name都是‘login_frame'
在定位