python抓取网页信息保存为xml文件_用Python抓取XML文件

如果您能够对文档运行xslt—我想您可以—另一种方法将使这变得非常简单:<?xml version="1.0" encoding="utf-8"?>

xmlns:msxsl="urn:schemas-microsoft-com:xslt" exclude-result-prefixes="msxsl"

>

Code,Source

,

注意元素的存在-这是为了插入换行符,这些换行符在CSV中语义上很重要,但在XML中不重要。在

输出:

^{pr2}$

要想在Python中运行它,我想您需要类似于this question中建议的方法:import lxml.etree as ET

dom = ET.parse(xml_filename)

xslt = ET.parse(xsl_filename)

transform = ET.XSLT(xslt)

newdom = transform(dom)

print(ET.tostring(newdom, pretty_print=True))

我不使用Python,所以我不知道这是否正确。

哎哟-我还忽略了您的XML文档是无效的-在第11行和第14行中缺少了开头的元素。将这些添加到它们所属的位置可以使文档转换正确。在

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值