我的爬虫学习
xpath找不到东西
上午刚出现了个xpath+text()找不到东西,下午就遇到了xpath找不到东西,这整的。。。
xpath是这个
/html/body/div[4]/div[2]/div[2]/ul/li[3]/table/tbody/tr[2]/td[3]/a/@href
在浏览器的xpath插件也试过了没问题,问了问同事也说不知道,最后百度了一会发现是浏览器对html文本进行了规范化,在路径里面加入了tbody,只需要删掉tbody这个就可以了
/html/body/div[4]/div[2]/div[2]/ul/li[3]/table/tr[2]/td[3]/a/@href
只需要变成这样就可以正常使用了