xpath抓不到东西之网页结构与检查的不一样
今天遇到了个更神奇的操作,xpath找不到东西!我在用scrapy的时候.xpath死活都抓不到东西,而且我的xpath绝对没写错(与检查的一致),我今天就不用正则,老子非要把你用xpath抓出来不行
tbody
tbody 在response里没有,这是浏览器用来标准化格式的一个标签,
tbody 在response里没有,这是浏览器用来标准化格式的一个标签,
tbody 在response里没有,这是浏览器用来标准化格式的一个标签(好像是这么说的)
如果你找不到的话有可能是因为你右键copy xpath后没去掉tbody
我怀疑是狗贼前端故意的
仔细分析了response之后,我就感觉有点不对,response里的标签经常有没有收束的问题,重新排列了之后竟然跟f12检查出来的不一样!!!!!!!!!!!!这是怎么做到的???。然后我怀疑是浏览器自带的tbody把格式标准化了,把没收束的标签自己收了,然后作者故意不收标签,这样看到的标签跟实际的标签其实不在一个位置,我觉得这人也是有意思,我用正则不是分分钟给你整出来了?(也有可能他是真笨)
答案
把response(或者是查看网页源代码)整出来后,重新排列,对比一下跟你检查到的是不是不一样,尤其是有些人(我)喜欢用Xpath helper, 潜意识认为xpath helper找得到的就是没问题的,太年轻啦,当然,我同事竟然不知道tbody问题哈哈,溜了