项目场景:
在爬取双色球信息时,我通过F12检查找到了目标区域
可以看到,这个tbody下的tr中的目标数字就是我们想要的信息,但其中含有class=“tdbck”属性的tr只是一条线,我们在用xpath时要把它拿掉
解决方案:
使用“not”将不含有class=“tdbck”属性的tr挑选出来,然后再进行进一步的处理
trs = e.xpath('//tbody[@id="tdata"]/tr[not(@class)]')
ps:之所以分享上述内容是因为我之前使用xpath爬取数据时不知道还可以这样操作,但它确实在某些情况下是很有用的;还有就是本人不玩双色球,只是在练习,大家千万别想多了