![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
Alex-7c
这个作者很懒,什么都没留下…
展开
-
WebDriver--定位元素的8种方式
在UI层面的自动化测试开发中,元素的定位与操作是基础,也是经常遇到的困难所在。webdriver提供了8种定位:1. id定位:find_element_by_id("id值");id属性是唯一的driver.find_element_by_id("loginName").clear()#用户名输入框的id属性driver.find_element_by_id("loginName")...转载 2018-09-13 11:40:28 · 472 阅读 · 0 评论 -
Selenium+PhantomJS使用时报错原因及解决方案
问题今天在使用selenium+PhantomJS动态抓取网页时,出现如下报错信息:UserWarning: Selenium support for PhantomJS has been deprecated, please use headless versions of Chrome or Firefox insteadwarnings.warn('Selenium suppor...转载 2018-09-13 15:13:30 · 319 阅读 · 0 评论 -
Python+Selenium定位不到元素常见原因及解决办法(报:NoSuchElementException)
在做web应用的自动化测试时,定位元素是必不可少的,这个过程经常会碰到定位不到元素的情况(报selenium.common.exceptions.NoSuchElementException),一般可以从以下几个方面着手解决:1.Frame/Iframe原因定位不到元素: 这个是最常见的原因,首先要理解下frame的实质,frame中实际上是嵌入了另一个页面,而webdriver每次只能...转载 2018-09-13 15:55:40 · 436 阅读 · 0 评论 -
selenium WebDriver定位元素学习总结
定位元素先要掌握基本的HTML语法:http://blog.csdn.net/jojoy_tester/article/details/53222425http://blog.csdn.net/jojoy_tester/article/details/53228674webdriver属于selenium体系中设计出来操作浏览器的一套API,webdriver是python的一个用于实...转载 2018-09-13 17:10:44 · 184 阅读 · 0 评论 -
python爬虫(一)--------selenium+python+PhantomJS的使用
最近爬取相关网站时,发现没有找到js包的地址,我就采用selenium来爬取信息,相关实战链接:python爬虫实战(一)--------中国作物种质信息网一、Selenium介绍 Selenium 是什么?一句话,自动化测试工具。它支持各种浏览器,包括 Chrome,Safari,Firefox 等主流界面式浏览器,如果你在这些浏览器里面安装一个 Selenium 的插件,那么便可...转载 2018-09-13 17:17:00 · 336 阅读 · 0 评论 -
python使用selenium webdriver从隐藏元素中获取文本
由于webdriver spec的定义,Selenium WebDriver 只会与可见元素交互,所以获取隐藏元素的文本总是会返回空字符串。 可是,在某些情况下,我们需要获取隐藏元素的文本。这些内容可以使用element.attribute('attributeName'), 通过textContent, innerText, innerHTML等属性获取。innerHTML 会返回元素的内...原创 2018-09-13 17:20:51 · 6161 阅读 · 0 评论 -
selenium:定位以及切换frame/iframe
frame需层层切,frameset不用切!很多人在用selenium定位页面元素的时候会遇到定位不到的问题,明明元素就在那儿,用firebug也可以看到,就是定位不到,这种情况很有可能是frame在搞鬼(原因之一,改天专门说说定位不到元素,可能的一些原因及处理办法)。frame标签有frameset、frame、iframe三种,frameset跟其他普通标签没有区别,不会影响到正常的定...转载 2018-09-14 09:37:35 · 510 阅读 · 0 评论 -
python使用selenium和pytesser3处理爬虫页面中的验证码
from selenium import webdriverimport pytesser3import timedriver = webdriver.Chrome()# 循环输入验证码,因为一遍可能不能正确识别,直到正确识别,再进行其他操作accept = Falsewhile not accept: try: # 打开含有验证码的搜索页 ...转载 2018-10-10 16:33:08 · 212 阅读 · 0 评论