【旧】2004-1-28 1:25:59 软件技术前沿:关于XML和RSS(2) ——学习xml--《无废话xml》

原创 2004年07月01日 15:40:00
软件技术前沿:关于XML和RSS(2)?——学习xml--《无废话xml》

2004年1月28日星期三?1时25分59秒
?Xml是个筐,什么都能往里装。第一次对XML有概念是在大富翁论坛,觉得没什么。又是一个泡沫,虽然很美丽,吹破了也只剩一滩水。

?标准的制定是一个比较有意思的事情。为什么要制定,如何协调各方面的利益,如何和现有系统兼容,如何保持扩展性

?晚上看了《无废话XML》,台湾人的确很会写书,深入浅出,生动有趣。呵呵,不过还是没什么概念。CSS不是什么新东西,HTML更不用说了,这个年代,什么都要炒作。

?简单说,XML就是类似于HTML的标记语言,但是语法更严格,要做到well-formed
?1.?标签tag必须关闭,也就是一定要配对
?2.?标签不能交叉,只能嵌套。(一直都很讨厌HTML的tag交叉,现在好了,终于出标准了)
?3.?所有属性要加引号(这是我常犯的毛病,从来不写引号,麻烦不好看)
?4.?通通小写。

?推行XML的目的
?1.?最关键的目的:为移动应用铺平道路。(这么深奥的道理居然都被我领悟了,牛!)晚上新闻里报道,香港已经开始提供3G服务了。对于五花八门,邋遢含糊的HTML代码以及各种各样的插件,需要一个非常庞大的浏览器程序来解释。而对于嵌入式设备,如手机、PDA,还有以后可能出现的智能家电,资源是非常有限的,恐怕就很难把这些网页按设计的原意显示出来。但移动应用恰好又是未来最有潜力的一个市场,资本家们是肯定不会放过的。


?关于字符编码,有点晕,总结一下

?ASCII???????1个byte?不废话了

?ISO8859-1???俗称的Latin-1?西欧字母??应该就是ASCII

?Unicode
?2个byte?前256=00+ASCII
?Unihan统汉字(中日韩)分布在0x3400-0x9FFF
?Big5和GB2312都在0x4E00-0x9FFF
?保留了0xD800-0xDFFF共2048个位置给代理对
?保留了0xE000-0xF8FF共6400个位置给私用区

?

?UTF-8??????
?不等长,1-3个byte
?Unicode转换到UTF-8按以下方式?
?0x0000-0x007F?不变?直接转为0x00-0x7F(1个byte)
?0x0080-0x07FF?->?B?110x?xxxx???10xx?xxxx
?0x0800-0xFFFF?->B?1110?xxxx???10xx?xxxx???10xx?xxxx
?UTF-8能够有效解决半个汉字的问题。UTF-16等双字节编码方式,必须从头开始扫描才能确定字符边界。一旦错位,必须到下一个ASCII才能恢复

?UTF-16
?基本和Unicode相同,但增加了代理对(surrogate?pairs)的概念。Unicode保留了0xD800-0xDFFF共2048个位置给代理对。这个区域又分为高低部,第一部分(高部)0xD800-0xDBFF,第二部分(低部)0xDC00-0xDFFF。这样通过高低部(4个字节)就可以容纳一百多万个字?(1024×1024)。加上原先不使用代理部的unicode字符,就构成了UTF-16。
?之所以高低部不重叠,也是为了解决多字节的边界问题。

?疑问:
?1.?很久以前(至少三年前)就有.shtml格式的文件,和xhtml有没有关系。查一下。
?2.以后的文件都保存为XML,作为通用格式??太弱了吧,简直是开玩笑。
?
windywong 发表于 >2004-1-28 1:25:59 保存该日志到本地

版权声明:本文为博主原创文章,未经博主允许不得转载。

无废话XML--XML解析(DOM和SAX)

XML处理模式 处理XML有2种方式,DOM和SAX。一般的实际开发中,这2种使用的不多,直接用dom4j来解析XML就好了,包括CRUD等操作都很方便的。这里介绍的DOM和SAX是比较底层的,具体的...
  • u011794238
  • u011794238
  • 2014年12月26日 16:52
  • 1797

Java进阶学习第五天——XML入门

XML语言 XML的简介 XML技术用于解决什么问题 XML常见应用 XML的语法 文档声明(重点) 元素 属性 注释 特殊字符 CDATA区 PI(处理指令) XML的约束 为什么需要约束 常用的X...
  • lutianfeiml
  • lutianfeiml
  • 2016年04月17日 18:23
  • 4390

schema、dtd、xml之间的关系

schema的专业叫法是模式,每一个web.xml都要 ============ schema和dtd都是对xml文件的进一步约束: 1xml文件中可以用哪些元素,如引用了web-app_2.4.xs...
  • Ideality_hunter
  • Ideality_hunter
  • 2016年05月29日 15:27
  • 2734

《无废话XML》——两只老虎

  • 2008年12月09日 09:47
  • 2.18MB
  • 下载

xml技术及其应用课件_1.ppt

  • 2012年10月11日 14:48
  • 277KB
  • 下载

XML编程技术大全(PDG).part1.rar

  • 2007年10月08日 20:21
  • 9.54MB
  • 下载

XML访问技术(1)

  • 2012年05月24日 15:42
  • 48KB
  • 下载

XML 编程技术大全1

  • 2009年05月20日 14:16
  • 16.21MB
  • 下载

XML编程技术大全(PDG).part1.rar

  • 2009年09月27日 16:14
  • 14.31MB
  • 下载

java学习【2】xml语法笔记【1】

编码、字符集 UTF-8:万国码,(1-6字符) GB2312:国标码(简体) GBK:国标码(简体、繁体),GB2312升级版 GB18030:国标码(简体、繁体、少数名族),GBK升级版 ...
  • u014204381
  • u014204381
  • 2014年10月16日 20:24
  • 165
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:【旧】2004-1-28 1:25:59 软件技术前沿:关于XML和RSS(2) ——学习xml--《无废话xml》
举报原因:
原因补充:

(最多只允许输入30个字)