Python数据挖掘(爬虫强化)

前端收割机

于 2024-04-30 10:49:04 发布

阅读量92

点赞数 3

分类专栏：程序员文章标签： python 爬虫开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_60452141/article/details/138338529

版权

程序员专栏收录该内容

207 篇文章 0 订阅

订阅专栏

这里可以自己测试一下，我所使用的是Google的浏览器，你们可以尝试使用Firefox,他们有一些的区别，主要是站点的区别！

2、进入页面后锁定tag

html:

python:

这里每一个都是锁定tag树，它们都是根据id，class，name，tagname来定义的。

这是通用方法的，Xpath方法，它们都输属于解析网页的内容锁定tag。

3、处理操作：

当我们锁定功能键的tag属性的时候，我们就可以进一步操作，比如换页，搜索功能的实现

这里我们就介绍一下模拟鼠标的操作：

因为时间问题，我只是介绍一下鼠标左键单击换页操作，其他的何以参考一下官方文档：Selenium Webdrive

ActionChains：锁定浏览器，double_click锁定tag标签树，.perform()：点击标签树

4、获取价值数据

这里的操作类似与Xpath的语法：

这里注意一下elements，指所有的tag-> a比标签的href，这里是list格式，需要遍历。

5、最后来一串完整代码：

selenium有个小GUB，就是在用Xpath的时候，你已经找到父级tag，但是这个父级很多，比如tr，你如果遍历它，寻找td的话，那么你还是使用find_elements_by_tag_name，因为那个会初始化，不会管你找到那个父级。所以这里是需要注意的！

现在能在网上找到很多很多的学习资源，有免费的也有收费的，当我拿到1套比较全的学习资源之前，我并没着急去看第1节，我而是去审视这套资源是否值得学习，有时候也会去问一些学长的意见，如果可以之后，我会对这套学习资源做1个学习计划，我的学习计划主要包括规划图和学习进度表。

分享给大家这份我薅到的免费视频资料，质量还不错，大家可以跟着学习

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友，可以戳这里无偿获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！
一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

前端收割机

关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
Python数据挖掘(爬虫强化)

现在能在网上找到很多很多的学习资源，有免费的也有收费的，当我拿到1套比较全的学习资源之前，我并没着急去看第1节，我而是去审视这套资源是否值得学习，有时候也会去问一些学长的意见，如果可以之后，我会对这套学习资源做1个学习计划，我的学习计划主要包括规划图和学习进度表。selenium有个小GUB，就是在用Xpath的时候，你已经找到父级tag，但是这个父级很多，比如tr，你如果遍历它，寻找td的话，那么你还是使用find_elements_by_tag_name，因为那个会初始化，不会管你找到那个父级。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。