[原创]Python+selenium+Chrome爬取excel网站

最新推荐文章于 2022-12-23 14:14:47 发布

weixin_30522095

最新推荐文章于 2022-12-23 14:14:47 发布

阅读量102

点赞数

文章标签： python 测试

原文链接：http://www.cnblogs.com/hazelrunner/p/9020742.html

版权

最近要写一个水利网站的爬虫脚本，将网页中2个excel的数据，爬到一个excel表里

恩，就是下面的网页截图，一左一右两张表。左边日期控件，输入对应日期查询相应日期的数据。

看到这么简单的网页，真是好开心，分分钟就给你数据

用requests库，发post请求，使用fiddler或者Burpsuite抓包测试都正常，但是用脚本，始终获取不到page_source

终于，发现日期输入框的属性是 readonly，于是果断使用selenium删除掉readonly属性，然后获取page_source，用BeautifulSoup处理数据

同样方法把右表的数据提取出来，最后结果截图：

转载于:https://www.cnblogs.com/hazelrunner/p/9020742.html

weixin_30522095

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
[原创]Python+selenium+Chrome爬取excel网站

最近要写一个水利网站的爬虫脚本，将网页中2个excel的数据，爬到一个excel表里恩，就是下面的网页截图，一左一右两张表。左边日期控件，输入对应日期查询相应日期的数据。看到这么简单的网页，真是好开心，分分钟就给你数据用requests库，发post请求，使用fiddler或者Burpsuite抓包测试都正常，但是用脚本，始终获取不到page_source终于，发现日...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。