python中xml解析sax_python使用SAX解析xml

python 标准库包含SAX解析器,SAX用事件驱动模型,通过在解析XML的过程中触发一个个的事件并调用用户定义的回调函数来处理XML文件

在python中使用sax方式处理xml要先引入xml.sax中的parse函数,还有xml.sax.handler中的ContentHandler

ContentHandler类方法介绍

# characters(content)方法

# 调用时机:

# 从行开始,遇到标签之前,存在字符,content的值为这些字符串。

# 从一个标签,遇到下一个标签之前, 存在字符,content的值为这些字符串。

# 从一个标签,遇到行结束符之前,存在字符,content的值为这些字符串。

# 标签可以是开始标签,也可以是结束标签。

# startDocument()方法

# 文档启动的时候调用。

# endDocument()方法

# 解析器到达文档结尾时调用。

# startElement(name, attrs)方法

# 遇到XML开始标签时调用,name是标签的名字,attrs是标签的属性值字典。

# endElement(name)方法

# 遇到XML结束标签时调用。

# make_parser方法

# 创建一个新的解析器对象并返回。

# xml.sax.make_parser( [parser_list] ) # (parser_list - 可选参数,解析器列表)

# parser方法

# 创建一个 SAX 解析器并解析xml文档:

# xml.sax.parse( xmlfile, contenthandler[, errorhandler])

# 参数说明:

# xmlfile - xml文件名

# contenthandler - 必须是一个ContentHandler的对象

# errorhandler - 如果指定该参数,errorhandler必须是一个SAX ErrorHandler对象

# parseString方法

# parseString方法创建一个XML解析器并解析xml字符串

# xml.sax.parseString(xmlstring, contenthandler[, errorhandler])

# 参数说明:

# xmlstring - xml字符串

# contenthandler - 必须是一个ContentHandler的对象

# errorhandler - 如果指定该参数,errorhandler必须是一个SAX ErrorHandler对象

# eg_v1

import xml.sax

class MovieHandler(xml.sax.ContentHandler):

def __init__(self):

self.CurrentData = ""

self.type = ""

self.format = ""

self.year = ""

self.rating = ""

self.stars = ""

self.description = ""

# 开始元素处理

def startElement(self, tag, attributes):

self.CurrentData = tag

if tag == "movie":

print ("*****movie*****")

title = attributes["title"]

print ("title:",title)

# 元素结束处理

def endElement(self, tag):

if self.CurrentData == "type":

print ("type:",self.type)

elif self.CurrentData == "format":

print ("format:",self.format)

elif self.CurrentData == "year":

print ("year:",self.year)

elif self.CurrentData == "rating":

print ("rating:",self.rating)

elif self.CurrentData == "stars":

print ("stars:",self.stars)

elif self.CurrentData == "description":

print ("description:",self.description)

# 内容事件处理

def characters(self, content):

if self.CurrentData == "type":

self.type = content

elif self.CurrentData == "format":

self.format = content

elif self.CurrentData == "year":

self.year = content

elif self.CurrentData == "rating":

self.rating = content

elif self.CurrentData == "stars":

self.stars = content

elif self.CurrentData == "description":

self.description =content

if (__name__ == "__main__"):

parser = xml.sax.make_parser()

parser.setFeature(xml.sax.handler.feature_namespaces,0)

Headler = MovieHandler()

parser.setContentHandler( Headler )

parser.parse("movies.xml")

# *****movie*****

# title: Enemy Behind

# type: War, Thriller

# format: DVD

# year: 2003

# rating: PG

# stars: 10

# description: Talk about a US-Japan war

# description:

#

# *****movie*****

# title: Transformers

# type: Anime, Science Fiction

# format: DVD

# year: 1989

# rating: R

# stars: 8

# description: A schientific fiction

# description:

#

# *****movie*****

# title: Trigun

# type: Anime, Action

# format: DVD

# rating: PG

# stars: 10

# description: Vash the Stampede!

# description:

#

# *****movie*****

# title: Ishtar

# type: Comedy

# format: VHS

# rating: PG

# stars: 2

# description: Viewable boredom

# description:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值