python实战项目31:selenium采集招标网站公告

selenium采集招标网站公告

一、项目介绍

本次数据采集以某市建设工程交易服务中心数据为例,网址为“http://www.shcpe.cn/jyfw/xxfw/u1ai51.html”,网站首页如下图所示:
在这里插入图片描述
采集到的字段如下图所示:在这里插入图片描述

二、采集过程

本次数据采集使用的是selenium自动化网页爬虫技术,首先,在使用selenium打开网页之后,发现所需要的数据在一个iframe中,iframe的作用是在网页中嵌入另外一个网页,需要使用selenium切换到iframe中才能获取到其中的数据。为了方便起见,我们通过浏览器的开发者工具抓包,找到我们所需数据所在的网页,然后通过selenium直接打开网页即可。网址为“https://ciac.zjw.sh.gov.cn/XmZtbbaWeb/gsqk/ZbjgGkList.aspx”。
接下来,使用selenium操作浏览器模拟人的一系列操作比如鼠标点击、切换窗口等。在这个案例中,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值