上次已经成功配置了selenium在python中运行的环境,下面就是利用selenium正式爬取数据了。
为了让selenium逐个点击地区,系统和网络,完整爬取所有数据,我们需要将这些元素找到并调用click()方法
然而不管我通过class_name,tag_name还是x_path(完整的和相对的都尝试过),都不能成功定位到元素。
经过仔细分析网页结构我才发现,阿里云为了反爬虫,采用了iframe框架生成html网页,因此无法定位到网页内的元素。
经过查阅资料,我找到了应对方法,就是在定位元素前加上下面两行代码,切换到iframe中进行定位。
iframe=driver.find_element_by_id("iFrameResizer0") driver.switch_to.frame(iframe)
这样就能够定位到网页中的各个按钮了。