使用selenium的webdriver动态爬取网页时遇到的问题

最新推荐文章于 2024-08-06 00:03:32 发布

AI学渣

最新推荐文章于 2024-08-06 00:03:32 发布

阅读量7.6k

点赞数 4

分类专栏： python爬虫 python基础文章标签： python selenium xpath 动态爬虫中文编码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_28418387/article/details/53573681

版权

本文介绍了使用selenium的webdriver动态爬取网页时，涉及浏览器驱动的选择，如PhantomJS和Chrome的差异，以及如何在Python中启动它们。此外，还讨论了使用xpath选择元素的注意事项，尤其是在处理文本和属性时。在Python 2.x和3.x之间的编码和输入输出差异也是重点，包括中文编码问题和print语句的变化。

摘要由CSDN通过智能技术生成

一、浏览器驱动文件（如phantomjs.exe/chromedriver.exe）的自动读取

1、PhantomJS与chrome的区别：

chrome不用说，就是chrome浏览器嘛，使用chromedriver.exe文件就是用来启动chrome浏览器的，当在程序中运行chromedriver.exe时会自动启动chrome浏览器（前提是电脑中已经安装了chrome浏览器）并弹出chrome浏览器窗口。当在程序中运行phantomjs.exe文件时，并不会弹出任何浏览器窗口，提交url地址获取的内容或者JavaScript脚本都会在后台运行，其实PhantomJS可以理解为一个没有界面和窗口的浏览器。

2、PhantomJS与chrome在python中如何被驱动：

from selenium import webdriver

最低0.47元/天解锁文章

关注

4
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

AI学渣 CSDN认证博客专家 CSDN认证企业博客

码龄9年

25: 原创

18万+: 周排名

129万+: 总排名

26万+: 访问

: 等级

2070: 积分

66: 粉丝

231: 获赞

84: 评论

641: 收藏

私信

关注

热门文章

分类专栏

python爬虫 2篇
python基础 4篇
arcpy 2篇
GIS 11篇
ArcGIS 5篇
数据库 2篇
GeoServer 3篇
OpenLayer 4篇
深度学习 5篇
pytorch 1篇

最新评论

电脑自动修复重启无法进入系统问题解决方案
weixin_54582443: 可以的我成功了，首先efi分区就是系统引导分区，看磁盘大小大概200m的第一个基本就是。其次就是挂载c盘的时候如果说无法指定c盘就可以换一个盘符，例如assign letter=e，本文最主要的就是那个命令bcdboot c:这里如果挂载的系统盘是e就写e，命令最后一个是小写的唉喽，/l zh-cn，这条命令就是创建一个启动文件，把终端都关闭重启后会进入恢复界面，说需要修复，其实就是没法验证数字签名，里面说的去BIOS关闭安全模式，一般可关可不关，最好是关上，那个按Esc指定UEFI固件设置就是进入BIOS的，如果不知道怎么进BIOS就选择这个进入BIOS后关闭安全模式。之后重启还是会来到这个界面，这时候按F8指定启动设置，选择疑难解答-高级选项-启动设置，输入7好像就是关闭数字验证的那个，之后重启就可以进入系统了
python中os.system调用exe文件问题
2301_79727035: 请问您找到了吗
python中os.system调用exe文件问题
2301_79727035: 请问您找到了吗？
二值分割任务的Precision，Recall，Accuracy，F1-score，IoU的计算方式理解与代码实现
weixin_44118135: 请问这个地方为什么要加一个1e-6？
利用arcpy解决python代码运行过程中产生的中间数据
wine1998: 这个函数是不是只能用于数据类型是string的数，好像feature class 的用不了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。