Python + Selenium 爬虫小记

最新推荐文章于 2024-08-03 20:32:40 发布

jocelyn_s

最新推荐文章于 2024-08-03 20:32:40 发布

阅读量959

点赞数

分类专栏： python selenium 爬虫文章标签： python selenium 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/smilingc/article/details/53184063

版权

python 同时被 3 个专栏收录

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

最近做了一个FGO的英灵素材对照表，素材是参照了FGOWIKI/AppMedia还有爱萌游戏，开头用了一点收集技巧，本来想直接用爬虫，但是没有写过，所以后来基本上算是人工校对了一遍整个数据库..人都要疯。

不过工作完成之后就还是想搞一下爬虫，多一门手艺。现在还在代码完善阶段，记录一点相关的东西，权当开发手记吧。

感谢这些文章的指路：

Selenium 很强大
Selenium是我用来解析动态加载网页的利器。
开头扒一些网页发现没有办法弄下来数据，还以为我自己的方法出了问题，然后发现那部分数据是动态加载的，才想起来现在的网页技术已经日新月异。然后直接搜索【python + 爬虫 + 动态加载】，天都亮了。
别的就不说了。开头还想按照某个教程用Selenium获取整个网页之后用BeautifulSoup解析，后来发现直接Selenium定位功能太强大，直接就不用BeautifulSoup了。
按照我的理解的话，BeautifulSoup对静态网页的解析已经很了不起了，Selenium主要是利用了浏览器Driver，把自己当做一个浏览器，所以能够把所有动态加载的东西全部弄下来，就非常方便后面解析了。
hidden元素
是的，我昨天遇到的问题，就是Selenium能够定位到我想获取的元素了，但是并不能获取到具体的数据。然后查了一下，大概就是因为hidden标签的问题。有文章提到说因为Selenium虽然获取了所有代码，但是由于他本质还是基于浏览器，所以浏览器看不到的内容，他也获取不到。
一个解决方法是，定位内容之后，直接操作为可见，然后再获取值，准备尝试。

TBC

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

jocelyn_s CSDN认证博客专家 CSDN认证企业博客

码龄14年

21: 原创

27万+: 周排名

79万+: 总排名

12万+: 访问

: 等级

1055: 积分

4: 粉丝

8: 获赞

15: 评论

61: 收藏

私信

关注

热门文章

分类专栏

Deep Learning
Ubuntu 5篇
DL_caffe
C++
C# 10篇
Other 1篇
Database 5篇
MFC
OCX 1篇
软解卸载
msi 1篇
installer 2篇
python 1篇
selenium 1篇
爬虫 1篇
mysql 1篇
redis 1篇
InnoSetup 1篇
Window 1篇
日常生活geek
NVIDIA 1篇
docker 1篇
ASP.NET 3篇
GridView 1篇

最新评论

删除Ubuntu的UEFI启动项
gloomy_maple: 为什么我是指定的删除命令无效呀，参数错误
删除Ubuntu的UEFI启动项
jocelyn_s 回复我为小美上宗师: 明白！谢谢你~ 我学习一下你的方法，回头编辑一下到博客里面~！感谢分享~！
删除Ubuntu的UEFI启动项
我为小美上宗师回复 jocelyn_s: 我安装的是Ubuntu18.04，删除ubuntu的时候特暴力，就直接在win10里删除了ubuntu的分区，然后悲剧了，ubuntu残留的启动项还残留着。之前我用过diskpart删除的方法，发现没有用，我也试过其他的方法，大概有用bootice，easybcd等，发现都删除不了。之后用过楼主的方法，楼主的方法应该有用，不过我之前已经用过diskpart的方法，也没有esp分区的备份，so... 不过用管理员权限打开cmd运行 bcdedit /enum firmware 之后，可以看见Ubuntu的启动项在固件应用程序下，和EFI USB Device，EFI DVD/CDROM，EFI Network 在一个类别，所以我尝试在acer（我的机器是acer vx15）下载了bios的固件，刷新了bios，之后就没有ubuntu的启动项了。所以尝试过楼主的方法之后不能解决，或者之前用过diskpart，可以尝试在官网下载bios更新一下，可能解决这个问题。不过可能这个只是一个特例。ps：我使用的efi + GPT安装的win10 + ubuntu18.04 双系统，grub引导。
删除Ubuntu的UEFI启动项
jocelyn_s 回复 lyyap: 我看到你的命令好像少打了空格？有尝试将空格都敲上吗？（还是评论吞空格了囧）
删除Ubuntu的UEFI启动项
jocelyn_s 回复我为小美上宗师: 啊~ 能帮上忙就好！新版的Bios的话，请问一下是有操作我上述的方法之后再更新，还是直接更新就可以了呢？如果可以的话想知道一些细节，我更新到我的帖子上面去，帮助更多人可以吗？谢谢呀~

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。