基于Python3 防止中文乱码的XML读取分析方式实现


1. XML文件格式简述

XML(Extensible Markup Language)中文意思为可扩展标记语言标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言

通常情况下XML 文档的第一行是一个 XML 声明,这是文件的可选部分,它将文件识别为 XML 文件,有助于工具和人类识别 XML(不会误认为是 SGML 或其他标记)。可以将这个声明简单地写成 <?xml?>,或包含 XML 版本(<?xml version="1.0"?>),甚至包含字符编码,比如针对 Unicode 的 <?xmlversion="1.0" encoding="utf-8"?>

XML文件核心区域主要包括根元素、命名元素、嵌套元素以及元素的属性,本文中使用的文件内容如下所示

<?xml version="1.0"encoding="utf-8" standalone="yes" ?>

<root>

  <Item Value="这是一个测试"/>

  <ItemValue="This is a test"/>

</root>

2. 文件编码和内容编码

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值