python笔记：常用内建模块—XML

最新推荐文章于 2024-07-28 17:49:02 发布

zyckhuntoria

最新推荐文章于 2024-07-28 17:49:02 发布

阅读量739

点赞数

分类专栏： python foundation

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zyckhuntoria/article/details/81033972

版权

这篇博客介绍了Python中处理XML的两种方法：DOM和SAX。推荐使用SAX，因其内存占用小，解析速度快。文章详细阐述了如何使用SAX解析XML，包括start_element、end_element和char_data事件的处理，并提供了示例代码。此外，还提到简单的XML生成可通过字符串拼接实现，而复杂结构建议使用JSON。最后给出了一道关于解析URL内容的练习题。

摘要由CSDN通过智能技术生成

一、DOM vs SAX

操作XML有两种方法：DOM和SAX。DOM会把整个XML读入内存，解析为树，因此占用内存大，解析慢，优点是可以任意遍历树的节点。SAX是流模式，边读边解析，占用内存小，解析快，缺点是我们需要自己处理事件。

优先考虑SAX，因为DOM实在太占内存

二、使用SAX解析XML

需准备好这3个函数：start_element，end_element和char_data，就可开始解析XML。

举例，当SAX解析器读到一个节点时：

<a href="/">python</a>

产生三个事件：

1、start_element事件，在读取<a href="/">时；

2、char_data事件，在读取python时；

3、end_element事件，在读取</a>时。

解析一段xml的代码：

from xml.parsers.expat import ParserCreate

class DefaultSaxHandler(object):
    def start_element(self, name, attrs):
        print('sax:start_element: %s, attrs: %s' % (name, str(attrs)))

    def end_element(self, name):
        print('sax:end_element: %s' % name)

    def char_data(self, text):
        print('sax:char_data: %s' % text)

xml = r'''<?xml version="1.0"?>
<ol>
    <li><a h

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zyckhuntoria CSDN认证博客专家 CSDN认证企业博客

码龄9年

98: 原创

74万+: 周排名

203万+: 总排名

25万+: 访问

: 等级

3052: 积分

57: 粉丝

166: 获赞

24: 评论

309: 收藏

私信

关注

热门文章

分类专栏

最新评论

python笔记：网络编程—TCP编程（客户端）
qq_66395404: 打开sina.html显示302 found是咋回事啊
输入一个字符串，内有数字和非数字字符，例如 A123x456 17960？ 302tab5876 操作：将连续的数字作为一个整数，一次存放到一数组a中，例如123存放在a【0】中，456放在a【1】中
Te amo469: 0开头的整数不应就是取大于0的那部分吗？比如0034就等于34啊，前面的0并没有意义不是吗？楼主写的很清晰
python笔记：图形界面
邵大白: 解决了，感谢大佬的分享！
python笔记：图形界面
邵大白: cannot use geometry manager pack inside . which already has slaves managed by grid
13个人围成一圈，从第1个人开始顺序报号1，2，3。凡报到3者退出圈子
开心就要bili: #include <stdio.h> #include <stdlib.h> #define N 13 struct person { int number; int nextp; } link[N + 1]; //创建结构体数组,记得最后加上；符号 int main(int argc, char *argv[]) { //赋值 int i; for (i = 1; i <= N; ++i) { if (i == N) link[i].nextp = 1; //在数字13的邻近点为1，可以形成一个循环 else link[i].nextp = i + 1; //在数字i的邻近点为i+1，依次进行赋值的操作。 link[i].number = i; //number 即为该数字 } //进行报道，数到三的人退出圈子 int j = N; i = 0; int count = 0; //i 进行清0操作 printf("出圈成员及顺序："); while (count < N - 1) //注意，此处循环应该是出圈的人数应该小于总的人数。否则的就停止出圈、循环报数 { while (i < 3) { j = link[j].nextp; //必须写在if（i==3）的前面 if (link[j].number) { i++; //如果这个数字没有出圈的话将其计入在其中 } //如果j这个数字出圈的话，就查看他的邻位数字 } if (i == 3) { printf("%3d", link[j].number); //出圈 link[j].number = 0; // 将该数字为0，代表出圈 count++; //进行count++，计数出圈的总人数

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。