使用Selenium实现动态网页的信息爬取

最新推荐文章于 2023-05-31 17:42:31 发布

羚漆

最新推荐文章于 2023-05-31 17:42:31 发布

阅读量609

点赞数

文章标签： selenium chrome python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zero_zero_seven/article/details/122006469

版权

目录酱

一、配置环境
二、对百度进行自动化测试
总结
参考文档

一、配置环境

要使用selenium去调用浏览器，还需要一个驱动，不同浏览器的驱动需要独立安装
selenium官网下载：https://www.selenium.dev/downloads/
Chrome浏览器驱动下载链接：https://npm.taobao.org/mirrors/chromedriver/
解压后是exe文件
将该文件添加到环境变量PATH下
安装selenium

conda install selenium
pip install selenium

输入命令后输入y回车确认

安装webdriver_manager解决webdriver的管理问题

pip install webdriver_manager
conda install webdriver_manager

二、对百度进行自动化测试

打开浏览器，进入百度搜索界面

from selenium import webdriver
driver=webdriver.Chrome('D:\\下载软件\\chromedriver_win32\\chromedriver.exe')
#进入网页
driver.get("https://www.baidu.com/")

对百度页面右键检查或者点击电脑F12快捷键
可以发现搜索框的id是kw
找到该元素，并填取对应的值

p_input = driver.find_element_by_id("kw")
p_input.send_keys('死妖阿')

同样检查网页找到按钮百度一下的id，为su
点击该按钮

p_btn=driver.find_element_by_id("su")
p_btn.click()

总结

完成了动态网页的信息爬取，就是爬取的速度比较慢，模拟人去点击网页，还是需要先找到相关元素。

参考文档

https://blog.csdn.net/m0_49297422/article/details/121957905

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
使用Selenium实现动态网页的信息爬取

目录酱一、配置环境二、对百度进行自动化测试总结参考文档一、配置环境要使用selenium去调用浏览器，还需要一个驱动，不同浏览器的驱动需要独立安装selenium官网下载：https://www.selenium.dev/downloads/Chrome浏览器驱动下载链接：https://npm.taobao.org/mirrors/chromedriver/解压后是exe文件将该文件添加到环境变量PATH下安装seleniumconda install seleniumpip i
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。