Selenium快速上手和常见问题小节

最新推荐文章于 2024-08-06 15:41:09 发布

njaumj

最新推荐文章于 2024-08-06 15:41:09 发布

阅读量222

点赞数

分类专栏：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/njaumj/article/details/85041644

版权

爬虫专栏收录该内容

1 篇文章 0 订阅

订阅专栏

不懂，为什么onenote复制到csdn差异这么大

准备：为电脑安装chrome和chrome driver，配置环境变量

1.声明使用的浏览器对象

browser = webdriver.Chrome()

browser = webdriver.PhantomJS()

2.访问页面

browser.get('https://www.taobao.com')

3.查找元素

首个节点 find_element_by_**

所有节点 find_elements_by_**

xpath的情况有点特殊

driver.find_element_by_xpath('//button[@id="logout"]')

4.节点交互

输入文字时用send_keys()方法

input = browser.find_element_by_id('q')

input.send_keys('iPhone')

清空文字时用clear()方法

input.clear()

点击按钮时用click()方法

button = browser.find_element_by_class_name('btn-search')

button.click()

5.获取元素内容

获取属性

logo = browser.find_element_by_id('zh-top-link-logo')

print(logo.get_attribute('class'))

获取文本值

print(logo.text)

获取tag_name

print(logo.tag_name)

6.网页内容

driver.page_source #对它用beautifulsoup进一步处理

driver.title

driver.click

参考： https://cuiqingcai.com/5630.html

问题小节

对于click无效的问题

点击前加一行time.sleep(5)试试，亲测有效

网站 http://a.suda.edu.cn/ 在logout后会跳到一个新网站。这种变化driver无法维护需要重新加载（在加一行driver.get('http://a.suda.edu.cn/') ），否则第三节的查找元素会出错误。而像在线时长这种时钟形式的变动则无需重新加载driver的。

出于效率考虑，在调试完成后，可以将浏览器引擎从chrome换成隐式的PhantomJS
好像没有查到通过多个属性标签定位一个元素的语法，一种方法是指定find_elements_by_**的index，如

elements = driver.find_elements("css selector", ".mnav")

print(elements[3].text)

或者遇到不定的情况，遍历elements通过第五节获得元素内容来逐个确认。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Selenium快速上手和常见问题小节

不懂，为什么onenote复制到csdn差异这么大准备：为电脑安装chrome和chrome driver，配置环境变量 1.声明使用的浏览器对象browser = webdriver.Chrome()browser = webdriver.PhantomJS() 2.访问页面browser.get('https://www.taobao.com') 3.查...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。