Xpath text()爬取表格其中一个标签为空导致列表长度不一致

最新推荐文章于 2023-04-24 20:30:35 发布

KingsCC

最新推荐文章于 2023-04-24 20:30:35 发布

阅读量1k

点赞数 1

分类专栏： Python 杂七杂八小tip

本文链接：https://blog.csdn.net/KingsCC/article/details/108392991

版权

杂七杂八小tip 同时被 2 个专栏收录

10 篇文章 0 订阅

订阅专栏

Python

3 篇文章 0 订阅

订阅专栏

需求：想要获取列表["null","00"]，但是使用text()只能得到["00"]
解决如果是Xpath2.0的话，可以使用
```
contents4=selector.xpath('//li[@class = "tag_1"]//td/split(.)')
```
但是相信大多数人使用lxml，貌似仅仅支持Xpath1.0的亚子，因此只能先用//td获取td标签列表，再针对标签列表中每个标签调用.text

html = '''
    <li class="tag_1">
       <td></td>
       <td>00</td>
    </li>
    
'''
 
selector =  etree.HTML(html )
contents4=selector.xpath('//li[@class = "tag_1"]//td')
x=[]
for c in contents4:
    x.append(c.text)
print(x)

吐槽：在国内论坛上没有搜到相关的解决方式，只能感谢万能的StackOverflow