动态网页 —— selenium+案例

最新推荐文章于 2022-10-27 15:45:43 发布

门前一头牛

最新推荐文章于 2022-10-27 15:45:43 发布

阅读量1k

点赞数

分类专栏： python--爬虫 Python 文章标签：数据库 selenium python

本文链接：https://blog.csdn.net/qq_46924416/article/details/116998531

版权

本文深入探讨selenium库在处理动态网页时如何切换frame，通过实例爬取qq邮箱，阐述switch_to.frame(), switch_to.default_content()和switch_to.window()的用法，并强调了窗口切换在动态网页抓取中的重要性。最后，说明了数据存储到数据库的步骤，提醒注意保护隐私。" 111534950,10293646,axios教程：安装与使用示例,"['前端开发', 'JavaScript', 'Vue', 'axios']

摘要由CSDN通过智能技术生成

在上一次博客动态网页——selenium基础中我们在最后有提到frame的窗口切换，但是并没有细讲，所以今天就是用selenium来爬取一个qq邮箱，详细讲解selenium库@中frame的运用。

1、使用selenium总是出现定位错误？

很多人在动态网页爬取的时候使用selenium库的时候会遇到在这里插入图片描述
这种错误，可是反复检查网页源代码，发现元素明明就在那里，用firebug也可以看到，但是就是不可以去定位它，这个时候我们就要考虑一下我们的窗口有没有切换了！
因为webDriver只能在一个页面上对元素进行识别和定位，对于frame/iframe表单内嵌页面上的元素无法直接定位。

2、切换——switch_to.frame(）

 driver=webdriver.Chrome("F:\..\chromedriver.exe")
 driver.switch_to.frame(reference)

reference 是传入的参数，switch_to.frame（）是默认的取id和name属性。
并不是每一个frame/iframe表单都有id和name属性，那么这时我们可以用什么？

在这里插入图片描述

1，用frame的index来定位，从0开始

driver.switch_to.frame(0)

2，WebElement对象，直接用selenium定位元素

#如使用find_element_by_tag_name（）
driver.switch_to.frame(driver.find_element_by_tag_name("iframe"))

3、切换——switch_to.default_content(）

我们切换到frame表单中就只能对表单中的元素进行识别和操作，要想对主界面的元素进行识别和定位，是不可以的。所以这个时候我们就要切换回主文档。也称释放frame。

driver.switch_to.default_content()

4、切换——switch_to.window(）

如果获取新窗口的内容 switch_to.window(handle) 来进行窗口切换，可以从window_handles集中进行遍历，结合判断进行。handle是窗口的唯一标识符相当于网页的ID。

 driver=webdriver.Chrome("F:\..\chromedriver.exe")
 for handle in driver.window_handles:
 	print(handle)
 	driver.switch_to.window(handle)

5、案例——爬取qq_邮箱

我们在上一篇博客刚讲过，qq邮箱的登录，所以这次的案例我们也还是爬取qq邮箱中的信息吧。

~~绝对不是因为我懒得再找案例👀~~
在这里插入图片描述

emmm这次的案例几乎是没有什么新知识点的，要是说有的话，就是我之前没有出过关于Xpath的解析，后面我再出一篇关于Xpath解析的好了。
本次呢，我是直接保存到数据库中的。

最低0.47元/天解锁文章

门前一头牛

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录