今天笔者进行数据爬虫的时候遇到一个问题,所需要定位的input输入框元素和button按钮元素都没有ID和此class等属性。代码如下:
<div id="headerScaher" class="scaher hover">
<input type="text" placeholder="IP、域名、文件HASH(MD5/SHA1/SHA256)、邮箱">
<button></button>
</div>
之前笔者在用Selenium进行爬虫的时候,对ID和输入框的定位都是直接定位的,如下:
ip_put = wait.until(EC.presence_of_element_located((By.ID, 'ip')))
click_btn=wait.until(EC.presence_of_element_located((By.ID,'embed-captcha')))
解决办法是用XPATH,通过相对路径去获取,也就是先定位到其父节点或者更高节点的元素,然后再通过相对位置去定位所需元素:
ip_put = wait.until(EC.presence_of_element_located((By.XPATH, "//div[@id='headerScaher']/input")))