python 预处理XML格式文档经验总结

     XML(the Extensible Markup Language)格式为设计特定领域的标记语言提供了一个框架,它有时被用于表示已被标注的文本和词汇资源,不同于HTML标签是预定义的,XML允许我们组建自己的标签,不同于数据库,XML允许创建的数据不必事先指定其结构,它允许有可选、可重复的元素。

       Python的标准库xml.etree.ElementTree可以直接调用来处理XML格式的文档,这里主要参考博客Python标准库之xml.etree.ElementTree

      在处理XML格式的文档初始阶段,遇到了两个问题。

     ·一、编辑大容量XML文本

     一是如何打开XML格式的文档查看里面的内容,因为之前没有处理过XML格式的文档,所以我通过别人的建议进行尝试的软件主要有1、记事本,2、excel导入打开,3、notepad++,4、sublime ,5、UltraEdit(据说是处理XML格式文件采用比较多的一个软件)。

     然而,因为待处理的XML格式的文档所占内存有1.5G,所以以上软件都是处理到一半,就直接失去响应,进程中断(注:运行环境是32位笔记本电脑)。

     最后,通过多方查找资料,安装了软件VEDIT(具体的介绍参考

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值