爬虫_Alex-7c的博客-CSDN博客

爬虫

关注

关注数：文章数：8 文章阅读量：8630 文章收藏量：17

作者: Alex-7c

这个作者很懒，什么都没留下…

展开

WebDriver--定位元素的8种方式

在UI层面的自动化测试开发中，元素的定位与操作是基础，也是经常遇到的困难所在。webdriver提供了8种定位：1. id定位：find_element_by_id("id值")；id属性是唯一的driver.find_element_by_id("loginName").clear()#用户名输入框的id属性driver.find_element_by_id("loginName")...

转载 2018-09-13 11:40:28 · 472 阅读 · 0 评论
Selenium+PhantomJS使用时报错原因及解决方案

问题今天在使用selenium+PhantomJS动态抓取网页时，出现如下报错信息：UserWarning: Selenium support for PhantomJS has been deprecated, please use headless versions of Chrome or Firefox insteadwarnings.warn('Selenium suppor...

转载 2018-09-13 15:13:30 · 319 阅读 · 0 评论
Python+Selenium定位不到元素常见原因及解决办法（报：NoSuchElementException）

在做web应用的自动化测试时，定位元素是必不可少的，这个过程经常会碰到定位不到元素的情况（报selenium.common.exceptions.NoSuchElementException），一般可以从以下几个方面着手解决：1.Frame/Iframe原因定位不到元素：　　这个是最常见的原因，首先要理解下frame的实质，frame中实际上是嵌入了另一个页面，而webdriver每次只能...

转载 2018-09-13 15:55:40 · 436 阅读 · 0 评论
selenium WebDriver定位元素学习总结

定位元素先要掌握基本的HTML语法：http://blog.csdn.net/jojoy_tester/article/details/53222425http://blog.csdn.net/jojoy_tester/article/details/53228674webdriver属于selenium体系中设计出来操作浏览器的一套API，webdriver是python的一个用于实...

转载 2018-09-13 17:10:44 · 184 阅读 · 0 评论
python爬虫（一）--------selenium+python+PhantomJS的使用

　　最近爬取相关网站时，发现没有找到js包的地址，我就采用selenium来爬取信息，相关实战链接：python爬虫实战（一）--------中国作物种质信息网一、Selenium介绍　　Selenium 是什么？一句话，自动化测试工具。它支持各种浏览器，包括 Chrome，Safari，Firefox 等主流界面式浏览器，如果你在这些浏览器里面安装一个 Selenium 的插件，那么便可...

转载 2018-09-13 17:17:00 · 336 阅读 · 0 评论
python使用selenium webdriver从隐藏元素中获取文本

由于webdriver spec的定义，Selenium WebDriver 只会与可见元素交互，所以获取隐藏元素的文本总是会返回空字符串。可是，在某些情况下，我们需要获取隐藏元素的文本。这些内容可以使用element.attribute('attributeName'), 通过textContent, innerText, innerHTML等属性获取。innerHTML 会返回元素的内...

原创 2018-09-13 17:20:51 · 6161 阅读 · 0 评论
selenium：定位以及切换frame/iframe

frame需层层切，frameset不用切！很多人在用selenium定位页面元素的时候会遇到定位不到的问题，明明元素就在那儿，用firebug也可以看到，就是定位不到，这种情况很有可能是frame在搞鬼（原因之一，改天专门说说定位不到元素，可能的一些原因及处理办法）。frame标签有frameset、frame、iframe三种，frameset跟其他普通标签没有区别，不会影响到正常的定...

转载 2018-09-14 09:37:35 · 510 阅读 · 0 评论
python使用selenium和pytesser3处理爬虫页面中的验证码

from selenium import webdriverimport pytesser3import timedriver = webdriver.Chrome()# 循环输入验证码，因为一遍可能不能正确识别，直到正确识别，再进行其他操作accept = Falsewhile not accept: try: # 打开含有验证码的搜索页 ...

转载 2018-10-10 16:33:08 · 212 阅读 · 0 评论

爬虫

作者: Alex-7c

WebDriver--定位元素的8种方式

Selenium+PhantomJS使用时报错原因及解决方案

Python+Selenium定位不到元素常见原因及解决办法（报：NoSuchElementException）

selenium WebDriver定位元素学习总结

python爬虫（一）--------selenium+python+PhantomJS的使用

python使用selenium webdriver从隐藏元素中获取文本

selenium：定位以及切换frame/iframe

python使用selenium和pytesser3处理爬虫页面中的验证码