前言:
刚刚看完一个小破站的爬虫系列视频,加上最近有家里人参加高考,所以萌生了想要爬取大学录取分数线的想法,想要提取相关录取分数的数据,以供后面填志愿时使用
问题描述:
1.省略亿点细节,通过selenium点击动作,以及解析网页的源代码,从学校图片信息中得到了学校的数字,再通过此数字组成目标网页的网络地址,再点击历年分数栏得到目标网页。
2.目标网页有许多下拉框,我总共要用到三个下拉框,如下图所示
这里要先定位到下拉框,没有找到select的标签,如下图所示
如何解决:
3.面对非select的标签的下拉框的定位,主要分为两步
第一步:定位找到下拉框,并点击
第二步:定位到选项的element再点击
首先通过标签的属性值拿到下拉框的位置,这里有三个