Python基础教程(二十二):XML解析

💝💝💝首先,欢迎各位来到我的博客,很高兴能够在这里和您见面!希望您在这里不仅可以有所收获,同时也能感受到一份轻松欢乐的氛围,祝你生活愉快!
💝💝💝如有需要请大家订阅我的专栏【Python系列】哟!我会定期更新相关系列的文章
💝💝💝关注!关注!!请关注!!!请大家关注下博主,您的支持是我不断创作的最大动力!!!

引言

XML(eXtensible Markup Language),一种标记语言,常用于数据存储和交换。Python提供了多种库来解析和处理XML文档,如xml.etree.ElementTreelxmlxml.dom.minidom。本文将深入讲解如何使用Python的xml.etree.ElementTree库来解析和操作XML文档,通过具体案例帮助你掌握这一技能。

一、XML基础

XML文档由元素、属性和文本组成。元素由标签名定义,可以包含子元素和属性。一个典型的XML文档如下所示:

<catalog>
   <book id="bk101">
      <author>Gambardella, Matthew</author>
      <title>XML Developer's Guide</title>
      <genre>Computer</genre>
      <price>44.95</price>
      <publish_date>2000-10-01</publish_date>
      <description>An in-depth look at creating applications with XML.</description>
   </book>
   <!-- 更多 book 元素 -->
</catalog>

二、使用ElementTree解析XML

xml.etree.ElementTree是Python标准库的一部分,提供了一种快速、灵活的方式来解析和创建XML文档。

2.1 加载XML文档

import xml.etree.ElementTree as ET

# 解析XML文件
tree = ET.parse('books.xml')
root = tree.getroot()

2.2 遍历XML文档

# 遍历所有book元素
for book in root.findall('book'):
    title = book.find('title').text
    author = book.find('author').text
    print(f"Title: {title}, Author: {author}")

2.3 查找特定元素

# 查找所有标题中含有'Guide'的书籍
for book in root.findall(".//book[title='XML Developer's Guide']"):
    print(book.attrib)

2.4 修改XML文档

# 修改某本书的价格
for book in root.findall('book'):
    if book.attrib['id'] == 'bk101':
        new_price = book.find('price')
        new_price.text = '49.95'
        new_price.set('updated', 'yes')

# 写回XML文件
tree.write('books.xml')

2.5 创建XML文档

# 创建一个新的XML文档
root = ET.Element("catalog")
book = ET.SubElement(root, "book", attrib={"id": "bk101"})
ET.SubElement(book, "author").text = "Gambardella, Matthew"
ET.SubElement(book, "title").text = "XML Developer's Guide"
ET.SubElement(book, "genre").text = "Computer"
ET.SubElement(book, "price").text = "44.95"
ET.SubElement(book, "publish_date").text = "2000-10-01"
ET.SubElement(book, "description").text = "An in-depth look at creating applications with XML."

# 将新文档写入文件
tree = ET.ElementTree(root)
tree.write('new_books.xml')

三、案例分析之从XML文件中提取数据

假设我们有一个包含图书信息的XML文件,目标是从文件中提取所有书籍的作者和出版日期。

import xml.etree.ElementTree as ET

# 解析XML文件
tree = ET.parse('books.xml')
root = tree.getroot()

# 提取数据
authors = []
publish_dates = []
for book in root.findall('book'):
    author = book.find('author').text
    publish_date = book.find('publish_date').text
    authors.append(author)
    publish_dates.append(publish_date)

# 打印结果
print("Authors:", authors)
print("Publish Dates:", publish_dates)

四、性能与高级用法

虽然xml.etree.ElementTree库足够用于大多数情况,但对于大型XML文件,你可能需要考虑使用lxml库,它提供了更好的性能和额外的功能,如XPath支持。

五、总结

Python的xml.etree.ElementTree库提供了一套简单而强大的工具集,用于解析、操作和创建XML文档。通过本文的学习,你应该能够处理基本的XML文件操作。在实际项目中,根据需求选择合适的库和方法,可以让你更加高效地处理XML数据。不断练习和探索,你将能够掌握更多高级技巧,处理更复杂的XML文档和数据结构。


结束语

喜欢博主的同学,请给博主一丢丢打赏吧↓↓↓您的支持是我不断创作的最大动力哟!感谢您的支持哦😘😘😘
打赏下吧

💝💝💝如有需要请大家订阅我的专栏【Python系列】哟!我会定期更新相关系列的文章
💝💝💝关注!关注!!请关注!!!请大家关注下博主,您的支持是我不断创作的最大动力!!!

python相关文章索引文章链接
Python基础语法(一):标识符与保留字部分Python基础语法(一):标识符与保留字部分
Python基础语法(二):数据类型Python基础语法(二):数据类型
Python基础语法(三):运算符Python基础语法(三):运算符
Python基础语法(四):条件控制Python基础语法(四):条件控制
Python基础语法(五):循环语句Python基础语法(五):循环语句
Python基础语法(六):推导式编程Python基础语法(六):推导式编程
Python基础教程(七):函数编程-从基础到进阶Python基础教程(七):函数编程-从基础到进阶
Python基础教程(八):迭代器与生成器编程Python基础教程(八):迭代器与生成器编程
Python基础教程(九):Lambda 函数Python基础教程(九):Lambda 函数
Python基础教程(十):装饰器Python基础教程(十):装饰器
Python基础教程(十一):数据结构汇总梳理Python基础教程(十一):数据结构汇总梳理
Python基础教程(十二):模块Python基础教程(十二):模块
Python基础教程(十三):file文件及相关的函数Python基础教程(十三):file文件及相关的函数
Python基础教程(十四):OS 文件/目录方法Python基础教程(十四):OS 文件/目录方法
Python基础教程(十五):面向对象编程Python基础教程(十五):面向对象编程
Python基础教程(十六):正则表达式Python基础教程(十六):正则表达式
Python基础教程(十七):CGI编程Python基础教程(十七):CGI编程
Python基础教程(十八):MySQL - mysql-connector 驱动Python基础教程(十八):MySQL - mysql-connector 驱动
Python基础教程(十九):网络编程Python基础教程(十九):网络编程
Python基础教程(二十):SMTP发送邮件Python基础教程(二十):SMTP发送邮件
Python基础教程(二十一):多线程Python基础教程(二十一):多线程

❤️❤️❤️觉得有用的话点个赞 👍🏻 呗。
❤️❤️❤️本人水平有限,如有纰漏,欢迎各位大佬评论批评指正!😄😄😄
💘💘💘如果觉得这篇文对你有帮助的话,也请给个点赞、收藏下吧,非常感谢!👍 👍 👍
🔥🔥🔥Stay Hungry Stay Foolish 道阻且长,行则将至,让我们一起加油吧!🌙🌙🌙

  • 26
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

菜鸟小码

你的鼓励是我最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值