python 解析url上的xml_初学Python求助Python解析xml

又继续研究了一下,现在搞定了,说方法:

1. 我上面这段xml代码,一开始没有注意看,在每一个元素的结尾元素中都含有转义符,这就是为什么我用xml解析插件时一直保报错的原因,因为他不是正规的xml格式。我的方法是用正则替换掉:re.sub(r'()',r'\g<1>\g<2>',f_xml) 对于Python中的正则re的sub用法,可以看这里:http://mushanblog.com/blog/python-re-module-quickstart

2. 处理成正规的xml格式后,我这里还是用ElementTree来解析的,但在加载时又报错:

cElementTree.ParseError: XML or text declaration not at start of entity: line 2, column 0

这个错误我在网上没有找到合适的答案,不过根据字面意思来解决,就是在开头的地方有错误。这里我尝试这吧xml的文档声明给去掉了,居然没有报错。这里有些不理解为什么不能加? 我的方法:f_xml=test_xml.replace('<?xml version="1.0" encoding="gbk"?>','')

3. 然后再加载,就能获取到相应的节点了。

主要代码如下:

f_xml=test_xml.replace('<?xml version="1.0" encoding="gbk"?>','')

mat=re.sub(r'()',r'\g<1>\g<2>',f_xml)

xml_root_doc=ET.fromstring(f_xml)print(xml_root_doc)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值