什么是XML?

XML是一种可扩展标记语言,用于数据传输和存储,强调内容而非外观。与HTML不同,XML允许自定义标签并注重数据结构的规范性。XML元素是其基本构成单位,包括开始和结束标签,并要求正确嵌套。命名规则规定名称不能以数字或特殊字符开头,也不能与'xml'相同。注释、属性值需加引号。在处理XML时,可以使用DOM解析器读取文本内容。
摘要由CSDN通过智能技术生成

一、什么是XML?

XML指可扩展标记语言
XML是一种标记语句,很类似HTML
XML标签没有被预定义,需要自行定义标签

二、XML和HTML的差异:

  1. XML为不同的目的而设计
  2. XML被设计为传输和存储数据,其焦点是数据的内容,HTML被设计用来显示数据, 其焦点是数据的外观
  3. XML意在传输信息,而HTML意在显示信息

三、XML的特点

  1. XML可以自定义标签

<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>
 

上例中的标签没有在任何XML标准中定义过,比如<to><from>这些标签都是有作者自己发明的

  1. XML必须包含根元素
    XML 文档必须有一个元素是所有其他元素的父元素。该元素称为根元素。

<?xml version="1.0" encoding="UTF-8" ?>
<note>
    <to>George</to>
    <from>John</from>
    <heading>Reminder</heading>
    <body>Don't forget the meeting!</body>
</note>
 

如上所示,XML文件的根元素为note,剩下的4行描述的是根的子元素
所有的XML标签都必须有关闭标签,在XML中省略标签是非法的,所有的元素都必须有关闭标签。
如下所示:

<p>This is a paragraph</p>
<p>This is another paragraph</p>  
  1. XML标签对大小写敏感
    XML 标签对大小写敏感。在 XML 中,标签 <Letter> 与标签 <letter> 是不同的。
    必须使用相同的大小写来编写打开标签和关闭标签:

<Message>这是错误的。</message>
<message>这是正确的。</message> 

XML必须正确的嵌套:如下所示:由于 <i> 元素是在 <b> 元素内打开的,那么它必须在 <b> 元素内关闭。

<b><i>This text is bold and italic</i></b>
  1. XML 的属性值须加引号
    与 HTML 类似,XML 也可拥有属性(名称/值的对)。
    在XML 中,XML的属性值须加引号。请研究下面的两个XML文档。第一个是错误的,第二个是正确的:

 <note date=08/08/2008>
 <to>George</to>
 <from>John</from>
 </note> 
 <note date="08/08/2008">
 <to>George</to>
 <from>John</from>
 </note> 

在第一个文档中的错误是,note 元素中的 date 属性没有加引号。

  1. 标签可以自由命名
  2. 标签成对出现
  3. 标签可以重名

四、XML 中的注释

在 XML 中编写注释的语法与 HTML 的语法很相似:

<!-- This is a comment --> 

五、什么是 XML 元素?

XML 元素指的是从(且包括)开始标签直到(且包括)结束标签的部分。
元素可包含其他元素、文本或者两者的混合物。元素也可以拥有属性。

<bookstore>
<book category="CHILDREN">
  <title>Harry Potter</title> 
  <author>J K. Rowling</author> 
  <year>2005</year> 
  <price>29.99</price> 
</book>
<book category="WEB">
  <title>Learning XML</title> 
  <author>Erik T. Ray</author> 
  <year>2003</year> 
  <price>39.95</price> 
</book>
</bookstore> 
 

在上例中,<bookstore> 和 <book> 都拥有元素内容,因为它们包含了其他元素。<author> 只有文本内容,因为它仅包含文本。
在上例中,只有 <book> 元素拥有属性 (category="CHILDREN")。

六、XML 命名规则

XML 元素必须遵循以下命名规则:

  • 名称可以含字母、数字以及其他的字符
  • 名称不能以数字或者标点符号开始
  • 名称不能以字符 “xml”(或者 XML、Xml)开始
  • 名称不能包含空格

七、XML读取文本

from xml.dom import minidom

打开文件

root =minidom.parse(filepath)
firstnode =root.getElementsByTagName(onenode)[0]
secondnode=firstnode.getElementsByTagName(twonodee)[0].firstChild.data

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值