XML语法规则介绍及总结

XML解析库tinyxml2库使用详解-CSDN博客

一、基本语法

XML (Extensible Markup Language) 是一种标记语言,用于描述和存储数据。它的语法规则如下:

1.1 文档结构

        XML 文档必须有一个根元素,所有其他元素都必须嵌套在根元素内部。

        XML 文档可以包含元素、属性、文本内容和注释。

1.2 元素

        元素使用尖括号 <> 括起来,例如 <book> 和 </book>。

        元素必须正确嵌套,即开始标签和结束标签必须匹配。

        空元素可以用单标签表示,例如 <br/>。

1.3 属性

        属性定义在开始标签中,由名称和值组成,例如 <book id="123">。

        属性值必须用单引号或双引号括起来。

        同一个元素的属性不能重复。

1.4 文本内容

        元素可以包含文本内容,例如 <book>XML 入门</book>。

        文本内容不能包含 < 和 > 字符,否则会被误认为是标签。可以使用实体引用 < 和 > 来表示。

1.5 注释

        注释以 <!-- 开始,以 --> 结束,例如 <!-- 这是一个注释 -->。

        注释不能包含 -- 字符。

1.6 XML 声明

        XML 文档可以以 XML 声明开头,声明文档的版本和编码,例如 <?xml version="1.0" encoding="UTF-8"?>。

        XML 声明必须位于文档的第一行。

1.7 命名规则

        元素名称和属性名称区分大小写。

        元素名称应该简洁、有意义,遵循驼峰式命名法。

        属性名称应该简洁明了,遵循驼峰式命名法或全小写加下划线。

1.8 数据类型

        XML 支持基本的数据类型,如字符串、数字、日期等。

        可以使用 XML Schema 定义更复杂的数据类型。

1.9 命名空间

        命名空间用于解决元素和属性名称的歧义问题。

        命名空间以 URI 的形式定义,例如 <book xmlns="http://example.com/books">。

        元素和属性可以使用限定名称,例如 <b:book xmlns:b="http://example.com/books">。

1.10 实体引用

        XML 保留了一些特殊字符作为语法标记,如 <、>、&、"、'。

        如果需要在文本内容中使用这些字符,必须使用实体引用,例如 <、>、&、"、'。

1.11 CDATA 区

        CDATA 区用于包含原样输出的文本内容,不会被解析为 XML 标记。

        CDATA 区以 <![CDATA[ 开始,以 ]]> 结束。

1.12 处理指令

        处理指令用于向 XML 处理器发送特殊指令,以控制文档的处理方式。

        处理指令以 <? 开始,以 ?> 结束,例如 <?xml-stylesheet type="text/css" href="style.css"?>。

1.13 DTD 和 XML Schema

        DTD (Document Type Definition) 和 XML Schema 用于定义 XML 文档的结构、元素、属性等规则。

        DTD 使用自己的语法,XML Schema 使用 XML 语法。

        这些规则有助于验证 XML 文档的正确性。

1.14 编码

        XML 文档必须指定编码,常见的编码有 UTF-8、UTF-16、ISO-8859-1 等。

        编码信息可以在 XML 声明或文档类型定义中指定。

这就是 XML 的基本语法规则。遵循这些规则可以确保您的 XML 文档结构正确、可读性强。

二、Xml属性

        XML 属性是元素的附加信息,用于提供有关元素的额外细节。以下是 XML 属性的一些重要特点:

2.1 属性以键值对的形式出现在元素开始标签内部。

        属性名称和属性值使用引号括起来,例如 <book author="J.K. Rowling">。

        属性值可以使用单引号或双引号括起来。

2.2 属性类型

        属性可以是字符串、数字、日期等基本数据类型。

        通过 XML Schema 或 DTD,可以定义更复杂的属性类型,如枚举类型、正则表达式等。

2.3 属性命名

        属性名称应遵循与元素名称相似的命名规则,通常使用驼峰式或全小写加下划线。

        属性名称应该简洁、有意义,避免使用特殊字符。

        属性名称区分大小写,因此 author 和 Author 是不同的属性。

2.4 属性的作用

        属性用于提供元素的附加信息,如元素的类型、状态、特性等。

        属性可以帮助描述元素的语义,增强 XML 文档的可读性和可维护性。

        属性可以用于元素的分类、过滤、排序等操作。

2.5 属性与元素内容的关系

        属性通常用于提供元素的补充信息,而不是主要内容。

        元素的主要内容应该放在元素的开始标签和结束标签之间。

        如果属性可以完全描述元素的全部信息,则元素可以是自闭合标签,例如 <book author="J.K. Rowling" />。

2.6 属性的唯一性

        在同一个元素内,属性名称必须唯一,不能重复。

        如果需要表达同一类型的多个信息,可以使用多个属性或嵌套元素。

XML 属性是元素的附加信息,可以丰富 XML 文档的语义和表现力。合理使用属性有助于提高 XML 文档的可读性和可维护性。

三、Xml元素

        详细介绍 XML 元素的相关知识。XML 元素是构建 XML 文档的基本单元,它们描述了文档的结构和内容。以下是 XML 元素的主要特点:

3.1 元素语法

        元素由开始标签、内容和结束标签组成,例如 <book>...</book>。

        空元素可以使用自闭合标签,例如 <br />。

        元素可以包含文本内容、子元素或属性。

3.2 元素命名

        元素名称应该简单、有意义,遵循驼峰式或全小写加下划线的命名规则。

        元素名称应该避免使用特殊字符,如空格、标点符号等。

        元素名称区分大小写,因此 <Book> 和 <book> 是不同的元素。

3.3 元素嵌套

        元素可以包含子元素,形成嵌套结构。

        子元素必须完全包含在父元素的开始标签和结束标签之间。

        元素的嵌套关系体现了 XML 文档的层次结构。

3.4 元素内容

        元素可以包含文本内容、子元素或者两者的混合。

        元素的文本内容可以是普通文本、CDATA 区或实体引用。

        元素可以是空元素,没有任何内容。

3.4 元素属性

        元素可以包含一个或多个属性,用于提供元素的附加信息。

        属性以键值对的形式出现在元素开始标签内部。

        属性值必须使用引号括起来,可以是字符串、数字、日期等数据类型。

3.5 元素命名空间

        元素可以属于不同的命名空间,用于避免元素名称冲突。

        命名空间以 URI 的形式定义,通常使用前缀与元素关联。

        命名空间可以在根元素或任何子元素上定义。

XML 元素是 XML 文档的基本构建块,它们通过嵌套和属性描述了文档的结构和内容。合理使用元素有助于提高 XML 文档的可读性和可维护性。

四、Xml文本

         XML 文本内容的相关知识。XML 文本内容是元素中表示数据的部分,它可以是多种形式。以下是 XML 文本内容的主要类型:

4.1 普通文本内容

        这是最基本的文本内容形式,直接包含在元素标签之间。

        普通文本内容可以包含字母、数字、标点符号等常见字符。

        但是,如果文本内容中包含特殊字符,如 < 或 &,需要使用实体引用进行转义。

4.2 CDATA 区

        CDATA 区用于包含不需要解析的文本内容。

        CDATA 区以 <![CDATA[ 开始,以 ]]> 结束,中间的内容不会被 XML 解析器解析。

        CDATA 区常用于包含程序代码、特殊字符或者其他不需要解析的文本。

4.3. 实体引用

        实体引用用于表示 XML 保留字符,如 <、>、&、"、'。

        实体引用以 & 开头,以 ; 结尾,中间是预定义的实体名称或数字代码。

        常用的实体引用有 <、>、&、"、'。

        实体引用可以确保 XML 解析器正确解析特殊字符。

4.4 字符引用

        字符引用用于表示 Unicode 字符,格式为 &#decimal; 或 &#xhex;。

        字符引用可以表示任何 Unicode 字符,即使在元素内容中不能直接输入。

        字符引用常用于包含非 ASCII 字符或在特殊情况下表示字符。

XML 文本内容可以采用普通文本、CDATA 区或实体/字符引用的形式。合理使用这些形式可以确保 XML 文档中的文本内容被正确解析和显示。

五、总结

        XML 是一种功能强大、广泛应用的标记语言,它可以用于数据描述、交换、存储、验证、转换等多方面的应用场景。XML 的可扩展性和跨平台特性使其成为许多领域的标准格式。

  • 19
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
第一部分 XML简介 第1 章 XML概览 1.1 什么是XML 1.1.1 XML是元标记语言 1.1.2 XML描述的是结构和语义,而不是格式 1.2 为什么开发人员对XML感到激动 1.2.1 设计与特定领域有关的标记语言 1.2.2 自描述数据 1.2.3 应用间交换数据 1.2.4 结构化和集成的数据 1.3 XML文档的“生命” 1.3.1 编辑器 1.3.2 语法分析程序和处理程序 1.3.3 浏览器和其他工具 1.3.4 处理过程总结 .4 相关技术 1.4.1 超文本标记语言(Hypertext Markup Lan 1.4.2 级联样式单(Cascading Style Sheets) 1.4.3 可扩展的样式语言(Extensible Style Lan 1.4.4 URL和URI 1.4.5 XLink和XPointer 1.4.6 Unicode字符集 1.4.7 如何将这些技术融合在一起 1.5 本章小结 第2章 XML应用简介 2.1 什么是XML应用程序 2.1.1 化学标记语言(Chemical Markup Langu 2.1.2 数学标记语言(Mathematical Markup La 2.1.3 频道定义格式 2.1.4 经典文学 2.2 用于XMLXML 2.2.1 XSL 2.2.2 XLL 2.2.3 DCD 2.3 XML的后台应用 2.4 本章小结 第3章 第一个XML文档 3.1 Hello XML 3.1.1 创建一个简单的XML文档 3.1.2 保存XML文件 3.1.3 将XML文件装入Web浏览器 .2 考察简单的XML文档 3.3 赋于XML标记以意义 .4 为XML文档编写样式单 .5 将样式单附加到XML文档上 3.6 本章小结 第4章 数据的结构化 4.1 检查数据 4.1.1 击球手 4.1.2 投球手 4.1.3 XML数据的组织 4.2 数据的XML化 4.2.1 开始编写文档: XML声明和根元素 4.2.2 联赛(League)、(分部) Division和 4.2.3 球员数据的XML化 4.2.4 球员统计数据的XML化 4.2.5 将XML组装在一起 4.3 XML格式的优点 4.4 编制样式单以便显示文档 4.4.1 与样式单连接 4.4.2 为根元素指定样式规则 4.4.3 为标题指定样式规则 4.4.4 为球员和统计元素指定样式规则 4.4.5 本节小结 4.5 本章小结 第5章 属性、空标记和XSL 5.1 属性 5.2 属性与元素的对比 5.2.1 结构化的元数据 5.2.2 元元数据 5.2.3 有关元数据的说明 5.2.4 元素更具扩展性 5.2.5 使用属性的最佳时机 5.3 空标记 5.4 XSL

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值