xpath获取块元素下<br>下的信息

xpath获取块元素下<br>下的信息

再爬虫取字段的时候遇到一种类似下面的结构:

<p>

    <br>

    "通用名称:xxxxxx" 

</p> 

用xpath取的方式://p//text()  可获取到text信息,注意:这里的text()前面是俩个“/” 

 

更多xpath操作:

https://www.cnblogs.com/songshu120/p/5182043.html

posted @ 2018-01-08 14:54 python许三多 阅读( ...) 评论( ...) 编辑 收藏
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
你可以使用之前提到的 `xml.etree.ElementTree` 模块来解析XML字符串,并通过递归遍历XML树来查找满足条件的标签。以下是一段实现该功能的示例代码: ```python import xml.etree.ElementTree as ET def find_next_audio_xpath(xml_str, tag_name, text): root = ET.fromstring(xml_str) namespaces = {'ns': 'http://www.hikvision.com/ver20/XMLSchema'} def traverse(node, found): if found: return True for child in node: if child.tag == tag_name and child.text == text: found = True elif found and child.tag == 'Audio': for subchild in child: print(ET.ElementTree(root).getpath(subchild)) return True found = traverse(child, found) return found traverse(root, False) # 示例用法 xml_string = '''<?xml version="1.0" encoding="UTF-8"?> <StreamingChannelList xmlns="http://www.hikvision.com/ver20/XMLSchema"> <StreamingChannel xmlns="http://www.hikvision.com/ver20/XMLSchema"> <id>101</id> <channelName>Camera 01</channelName> <enabled>true</enabled> </StreamingChannel> <StreamingChannel xmlns="http://www.hikvision.com/ver20/XMLSchema"> <id>102</id> <channelName>Camera 01</channelName> <enabled>true</enabled> <Video> <enabled>true</enabled> </Video> <Audio> <enabled>false</enabled> <audioInputChannelID>1</audioInputChannelID> <audioCompressionType>MP2L2</audioCompressionType> </Audio> </StreamingChannel> </StreamingChannelList>''' find_next_audio_xpath(xml_string, 'id', '102') ``` 在上述示例中,`find_next_audio_xpath`函数接受三个参数:`xml_str`表示输入的XML字符串,`tag_name`表示目标标签名,`text`表示目标标签的文本内容。函数首先将XML字符串解析为一个元素树,并通过递归遍历树来查找满足条件的标签。当找到目标标签后,会继续遍历其后面的标签,如果遇到了标签名为'Audio'的标签,则会输出其子标签的XPath路径。 在示例中,输入的XML字符串是一个包含了两个 `<StreamingChannel>` 标签的例子。函数将找到一个满足条件的标签(id为102),并输出其后面的标签名为'Audio'的子标签的XPath路径。你可以根据实际需求修改代码,例如将匹配到的XPath路径存储到一个列表中返回。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值