sax模块处理xml

sax的简单用法

sax (Simple API for XML), 以事件处理为基础,按照遇到XML元素的顺序读取XML文档,触发处理函数来执行处理。
为此,我们需要定义自己的处理器(Handler),定义遇到XML元素时,执行什么样的处理动作。如startElement()方法,定义了遇到开始tag时,应该做些什么。以下是示范代码:

from xml.sax import ContentHandler, parse
class MyHandler(ContentHandler):
    def startDocument(self):
        pass
    
    def startElement(self, name, attrs):
        pass

    def endElement(self, name):
        pass

    def characters(self, content):
        pass

    def endDocument(self):
        pass

parse('sample.xml', MyHandler())

ContentHandler类方法介绍

characters(content)方法

调用时机:

  • 从行开始,遇到tag之前,存在字符,content的值为这些字符串。
  • 从一个tag,遇到下一个tag之前, 存在字符,content的值为这些字符串。
  • 从一个tag,遇到行结束符之前,存在字符,content的值为这些字符串。

tag可以是开始tag,也可以是结束tag。


startDocument()方法

文档启动的时候调用。


endDocument()方法

解析器到达文档结尾时调用。


startElement(name, attrs)方法

遇到XML开始tag时调用,name是tag的名字,attrs是tag的属性值字典。


endElement(name)方法

遇到XML结束tag时调用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值