~~问题描述:在使用xpath爬虫的过程中,我想提取带有某一属性的节点内部的文本,但输入节点和属性之后,并没有返回相关的文本,相关代码如下所示:
fujian1_text = fujian1_text_tree.xpath('//span[@class = "normal105"]//*/text()')
在这里我想活得span下所有子孙节点的内容,其中span节点的class属性是"normal105",但正常输入后无法获得相关的内容。
经过试验,我发现把源代码中的内容直接复制粘贴到对应位置,则可以得到文本内容,因此我有理由相信,xpath的路径更类似于字符串,空格什么的也会对路径产生影响,所以在使用属性确定节点的时候最好复制粘贴,防止出现一些肉眼无法发现的问题。~~
上述结论存在一定问题,待以后再碰到类似问题的时候再解决。