使用XPath返回空值
再练习使用XPath来爬取数据时,出现了以下情况,本人由于想要快捷,直接使用浏览器复制,结果返回了空的列表,为了验证,本人去浏览器搜索栏查看
一开始以为是复制错了,就自己写全
可还是返回了坑空列表
于是去网上查询,得到结果:浏览器会对html文本进行一定的规范化,所以会自动在路径中加入tbody,导致读取失败,在此处直接在路径中去除tbody即可。
于是将XPath语句写成:
//*[@id="billboard"]/div[2]/table/tr[1]/td[2]/a
或
/html/body/div[3]/div[1]/div/div[3]/div[5]/div[2]/table/tr[1]/td[2]/a