使用xml.sax 读取xml 文件

杨楠77

于 2023-04-13 14:54:59 发布

阅读量169

点赞数

文章标签： xml servlet java

本文链接：https://blog.csdn.net/qq_44774828/article/details/130130548

版权

使用 xml.sax 模块可以方便地读取 XML 文件。下面是一个简单的示例代码：

import xml.sax

class MyHandler(xml.sax.ContentHandler):
    def __init__(self):
        self.current_element = ""
        self.data = ""
        
    def startElement(self, name, attrs):
        self.current_element = name
        
    def endElement(self, name):
        if self.current_element == "title":
            print("Title: " + self.data)
        elif self.current_element == "author":
            print("Author: " + self.data)
        elif self.current_element == "year":
            print("Year: " + self.data)
        
        self.current_element = ""
        self.data = ""
        
    def characters(self, content):
        self.data += content

if __name__ == "__main__":
    # 创建 XMLReader 对象
    parser = xml.sax.make_parser()

    # 关闭命名空间
    parser.setFeature(xml.sax.handler.feature_namespaces, 0)

    # 设置 ContentHandler
    handler = MyHandler()
    parser.setContentHandler(handler)

    # 解析 XML 文件
    parser.parse("example.xml")

在上面的示例代码中，我们首先定义了一个 MyHandler 类，该类继承自 xml.sax.ContentHandler 类，并实现了 startElement()、endElement() 和 characters() 方法。这些方法会在 SAX 解析器解析 XML 文件时被调用。

在 startElement() 方法中，我们记录当前元素的名称。在 endElement() 方法中，我们根据当前元素的名称来打印元素的值。在 characters() 方法中，我们记录元素的值。

在主程序中，我们首先创建了一个 XMLReader 对象，并设置了 ContentHandler。然后，我们调用 parse() 方法来解析 XML 文件。解析过程中，SAX 解析器会自动调用 MyHandler 类中的方法来处理 XML 文件中的元素。最终，我们会得到 XML 文件中所有元素的值。

需要注意的是，由于 SAX 解析器是基于事件的，所以它可以处理任意大的 XML 文件，而不需要将整个文件加载到内存中。这使得 SAX 解析器成为处理大型 XML 文件的首选方法。