认识BLOG的技术

YIZ:: www.yiz.name
YIZblog:  blog.yiz.name

最近,和一位高手 zhangyining 请教blog技术。他首先让我先了解一下:
1.什么叫blog?
2.Blog特别之处在哪?
3.什么叫RSS?
4.什么是Atom?

为了对技术的热情,搜索了网络上的众多文章,现在贴些能解释以上问题的文章和自己的一些整理。

网上挺多文章,但我觉得 桃桃之家的“关于Blog和RSS技术的理解” 概述的还不错,让我确实对blog理解了甚多。这篇文章解释了以上的前三个问题。对于Atom我访问了 IBM开发者找了点资料解释了最后一个问题。
现在我就贴出这些文章给大家分享一下。

1.什么叫BLOG

Blog,是Weblog的简称。Weblog,是Web 和Log的组合词。Web,指World Wide Web;Log,原义是“航海日志”,后指任何类型的流水记录。Weblog 是在网络上的一种流水记录形式。Blogger或Weblogger,是指习惯于日常记录并使用Weblog工具的人。

 下面是桃之家的“关于Blog和RSS技术的理解” 的部分原文
//===============================================================
//==========++++++++++++++++++++++++++++++++++++++++++++=========

1.1 什么是Blog

 Blog是英文 Web log的简称,也就是你的网络日志,中文为"博客"。一个Blog就是一个网页,它通常是由简短且经常更新的帖子(Post)所构成,是"一种表达个人思想和网络链接、内容按照时间顺序排列、并且不断更新的出版方式"

1.2 Blog的历史

最古老的博客原型是19936NCSA的"What's New Page"网页,主要是罗列Web上新兴的网站索引,由于博客天然的草根性,使我们很难确定谁是博客的先祖,此后经过了几年的发展,直到20019月世贸大楼遭遇恐怖袭击,博客成为重要信息和灾难亲身体验的重要来源之后,博客才正式步入主流社会的视野,2002年博客开始在中国被推广并迅速得到普及,作为一种社会交流工具,博客将超越E-mailBBSICQIM),成为人们之间更重要的沟通和交流方式。

1.3 Blog的功能

到任意一个blog网站中注册后都可以拥有自己的网志,是人感觉不费劲就拥有了自己的网页,这也是blog之所以受欢迎之处。我们以blogchina为例看一下blog具有的功能:

(1)设置功能:点击设置按钮进入设置窗口,你可以在其中设置二级域名,博客类型,博客名称和外观,首页显示参数和其它杂项。

(2)模板选择功能:该功能对应设置中的外观,点击模板选择按钮,会出现好多个网站提供的界面样式,选择一个做为自己的blog的外观。

(3)文章管理功能:首先要点击文章分类按钮建立文章分类,然后在各个类别中添加、编辑文章,完成后点击"提交"。

(4)链接管理功能:首先要点击链接分类按钮建立链接分类,然后在各个类别中添加新的链接,需要输入链接的地址,并为其命名。

(5)附件管理功能:如果想把你电脑里的文章传到网上,需要添加附件,浏览粘贴后上传即可。

(6)评论管理功能:blog的主人可以对读者的评论进行管理,删除恶意的评论,让整个网页健康活泼。

1.4 Blog的作用

有人说Blog是一个个人文档中心,技术总结的中心,网上的日记本。最突出的作用表现在教育领域,blog作为一种新的网络学习工具也显示出了旺盛的生命力。在国外,许多组织和个人利用Blog系统进行学术研究和自主化学习。例如,世界知名的哈佛大学、斯坦福大学、加州理工伯克利分校等,都建立了Blog系统,并提供给师生免费使用;在国内,Blog系统的教育内化与应用正在迅速蔓延,在学术研究方面的应用也有一些创造性的尝试。基于BLOG的学习大大增强学生的自我意识;BLOG作为教学辅助工具,给老师的教学提供了极大的便利,使老师的思维方式和教学习惯发生了较大的变化,有利于信息时代研究性教师的成长。总之Blog作为一种新兴的学习工具,在自主学习、研究性学习、合作学习、深度思考等方面有着巨大的应用潜力,体现了独特的价值。

1.5blog的未来

那么blog的未来会是什么样子,这是好多人都关心的话题。方兴东这样说,"预测未来永远是一件很愚蠢的事情,尤其预测网络,对于博客的未来,现在要定论,的确太早!而且争议性很大。但是,根据我们的研究和判断,我们还是冒险地认同这样的一些大胆的判断:到2006年左右,作为一种新的媒体现象,博客的影响力有可能超越传统媒体;作为专业领域的知识传播模式,博客将成为该领域最具影响力的人物之一;作为一种社会交流工具,博客将超越E-mailBBSICQIM),成为人们之间更重要的沟通和交流方式。"

在中国,与所有的网络革命一样,blog也继续保持着一定的"滞后度"。现在中国的博客发展仅仅进入启蒙期,萌芽期,可能需要23年,才能进入真正的初级阶段,也就是崛起期。

//======+++++++++++++++++++++++++++++++++++++=========
=====================================================
2.BLOG的特点

以下引用网上的http://www.blogme.cn/node/view/225

“Blog与BBS,及网络论坛内的留言相比更能有机的组织个人的言论并与他人自由的交流,实际上它的个性化更强BLOGWOWO ;倒是和个人网站有些接近,但是用户友好性要好得多,并且得益于一些新兴技术的支持,可能拥有更加灿烂的未来。

  从前的互联网使用HTML描述信息,大家彼此是孤立的。Blog使用基于XML的RSS内容描述协议,使得大海中的孤岛彼此可以识别和交流,相信慢慢的、Blog会促进互联网络的改进,但是Blog本身将会走向何处,窃以为很难预测。

  例如,我们所在的Blog已经支持Trackback,这东西是什么意思呢?从前,你看到某某人写了什么文章、或者看到有意思的新闻,如果你想发表评论,那么,第一个选择是:你先转贴这篇文章、然后发表长篇大论,但是,别的人在看这篇原始文章的时候,并不知道你发表了评论,因为你发表的评论没有和原文产生任何联系。

  第二个选择是:也许原始文章所在地提供了评论功能,这样,你就可以发表评论了;但是,你东评论一下、西评论一下,你没有个人的总集,也许你的光辉灿烂的思想就淹没在信息和海洋里了。你说,这是不是多么让全人类遗憾的事啊?

  如果所有的网站都支持Trackback,就会是这样的:你想评论的文章位于A站,你的文集如Blog位于B站,你在B站上发表评论后,B站会Trackback到A站(自动的,只需提供Tackback URL),A站就知道你在B站发表了评论并链接你的评论,其他的阅读者也会知道你发表了评论。这样的时代你在看原始文章时,下面的评论可能来自许多不同的站点中的个人,这才是一张网。




3.什么叫RSS


以下引用了http://tech.sina.com.cn/i/w/2004-03-22/1101337107.shtml 这篇文章的部分内容。
//================================================================
//===========++++++++++++++++++++++++++++++++++++++++++===========

1. RSS前世今生

 每天有很多人在浏览CNETNews、Business Week Online、新浪、搜狐等网站上的新闻。不过,莉莉的做法是在计算机上安装一种名为“新闻阅读器”(newsreader)的软件。她可以迅速浏览各媒体上的标题和摘要,然后点击其中的链接,访问原来的网站获得更详细的资料。莉莉还有她的个人博客网站,一旦点击上面一个橙色按钮,“新闻阅读器”就会下载更新的内容,有时它还会检查刊物内容是否更新。

 RSS技术实现了这一切,并且除了文本新闻,它也已经“有声有色”。迪斯尼公司利用这一技术为ESPN.com和ABCNews.com发布视频新闻,苹果公司的iTunes则利用它向订户通报其最新的音乐内容。而且,这些网站上的所有内容都可以传输到各种各样的手持无线设备上。

2. RSS到底是什么?

可以是“Rich Site Summary(丰富站点摘要)”、“RDF Site Summary(RDF站点摘要,RDF是一种语义网技术)”,还可以是“Really Simple Syndication(真正简易聚合)”。这主要是因为该技术有不同的源头,不同的技术团体对其做出了不同的解释。

 它所做的事情其实很简单。以发布新闻的应用为例,发布新闻的站点每小时发布一个包含最新新闻列表以及相应链接的文档,而这一文档可以被其它站点收集并显示在其索引页面上,并且这个站点自动同步更新,以获取最新的新闻。其实就是把索引页面与新闻源站点发布的动态内容相连接而已,RSS则为此提供了一种组织单个信息和集合信息的有效结构。

 RSS诞生于Netscape公司1997年设计的描述新闻频道的语言,被用于分发其门户站点My.Netscape.Com上的内容的描述信息。当时与之对应的是微软IE 4的“新闻频道”,不过它采用的是支持IE的CDF(Channel Definition Format)数据规格,被业内人士称为“推技术”。RSS技术更像是“拉”,用户的收集器按特定的时间间隔从提供信息的网站上更新资料。“推技术”最终没落,但RSS也并未立即发扬光大。
由于Blog文化的推广,以及Blog广泛采用RSS作为信息交流技术, RSS的内容源一下子大为丰富, RSS技术不断的普及。RSS技术带来的最核心的一个概念就是聚合,所谓的聚合,就是指RSS阅读器能同时对很多RSS站点操作,使用RSS技术,能自动帮助你聚合你感兴趣的信息。

//======+++++++++++++++++++++++++++++++++++++=========
=====================================================

下面是桃之家的“关于Blog和RSS技术的理解” 的部分原文
//===============================================================
//==========++++++++++++++++++++++++++++++++++++++++++++=========
2.1什么是RSS技术

RSS
是英文Really Simple Syndication(简易信息聚合),是基于XML技术的互联网内容发布和集成技术。90年代末由Netscape (网景公司) 提出,并做进了互联网浏览器Navigator里,当时称为""技术,但当时在商业应用上并不成功。由于Blog文化的推广,以及Blog广泛采用RSS作为信息交流技术, RSS的内容源一下子大为丰富, RSS技术不断的普及。RSS技术带来的最核心的一个概念就是聚合,所谓的聚合,就是指RSS阅读器能同时对很多RSS站点操作,使用RSS技术,能自动帮助你聚合你感兴趣的信息。

2.2 RSS聚合器
2.2.1什么是RSS聚合器

RSS阅读器是一种软件或是说一个程序,这种软件可以自由读取RSSAtom两种规范格式的文档。可以读取RSSAtom文档的RSS阅读器就如同一份自己订制的报纸。每个人可以将自己感兴趣的网站和栏目地址集中在一个页面,这个页面就是RSS阅读器的界面。通过这个页面就可浏览和监视这些网站的情况,一旦哪个网站有新内容发布就随时报告,显示新信息的标题和摘要(Feed),甚至全文,这样就可以用更少的时间分享更多的信息。RSS阅读器将新信息带到了用户的桌面,而无需用户去各个网站一遍遍的搜索,用户只要打开设置好的RSS阅读器,就可以等着信息"找上门来"

2.2.2聚合器的版本

目前流行的RSS 阅读器有适用于Windows系统下的RssReaderFree Demon,用于Mac OS X 系统(苹果机多采用此系统)下的Net News Wire,还有用于掌上电脑等移动无线设备的Bloglines等。今年5月,第一个中文版的RSS阅读器--"看天下"诞生,汉化版的RSS阅读器"看天下新闻资讯阅读器"几乎就是Rssreader的一个翻版,功能、框架等基本相同。

2.2.3"看天下"聚合器的主要功能

⑴频道管理:用户可以把自己喜欢的网址添加到频道组中,当网站有更新时会自动提示用户有新新闻可以阅读。用户阅读的新闻和没有阅读的新闻都做了了不同的标记来区别。

⑵标签管理:是指用户可以把自己的喜欢的文章归类放好,日后查找方便。

2.3 RSS的本质

RSS XML的一种方言,所有的RSS都必须遵守发布在W3C网站上的XML1.0规范,具体版本有好多个,发展到至今经历了0.900.910.920.930.941.0 2.0 "看天下新闻资讯阅读器"阅读器支持的是RSS2.0。下面一个完整的RSS2.0的文档,可以被分成小块分别来看。我们以它为例来分析一下它与Blog的交互。

<?xml version="1.0" encoding="GB2312" ?>
- <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns="http://purl.org/rss/1.0/">
- <channel rdf:about="http://taolihui.blogchina.com">
- <title>
- <![CDATA[
桃桃的家
  ]]>
  </title>
- <description>
- <![CDATA[
最新的网络交流方式,为什么不体验一下?
  ]]>
  </description>
  <language>GB2312</language>
- <image>
- <title>
- <![CDATA[
blogchina.com
  ]]>
  </title>
- <url>
- <![CDATA[
http://www.blogchina.com/new/image/share/logo.gif
  ]]>
  </url>
- <link>
- <![CDATA[
http://www.blogchina.com
  ]]>
  </link>
  </image>
- <link>
- <![CDATA[
http://taolihui.blogchina.com
  ]]>
  </link>
  </channel>
- <item rdf:about="http://blog.blogchina.com/article_90201.407324.html">
- <title>
- <![CDATA[
关于blog和RSS技术的理解
  ]]>
  </title>
- <link>
- <![CDATA[
http://blog.blogchina.com/article_90201.407324.html
  ]]>
  </link>
- <description>
- <![CDATA[
 <p>1.背景介绍2.简单的使用3.RSS的规范介绍4.举例分析5.知识总结(有待更新)</p>
  ]]>
  </description>
  </item>
- <item rdf:about="http://blog.blogchina.com/article_90201.388820.html">
- <title>
- <![CDATA[
可爱的双胞胎(转贴)
  ]]>
  </title>
- <link>
- <![CDATA[
http://blog.blogchina.com/article_90201.388820.html
  ]]>
  </link>
- <description>
- <![CDATA[
 <img src="http://blog.blogchina.com/upload/2004-12-05/20041205163231210411.jpg" border="0" />
  ]]>
  </description>
  </item>
  </rdf:RDF>

具体解释如下:

⑴第一行是标准的XML文件的头部声明,确定版本号和使用的字符集

⑵第二行<rdf:RDF>为整篇文档的根元素,带有命名空间rdf,后面给出rdfURL和默认空间的URL

<channel>元素是RSS文档中必须的元素。它下面带有多个子元素,分别为<title><description><language><image><link>。它的about属性的URL必须是唯一的用来区分其它的<channel>,表现在blog中就是不同网址对应不同的<channel>

<title>元素里面的字符数据是要显示blog标题的。

<description>元素中的字符数据显示在blog的介绍中。

<langage>元素中的数据为使用聚合器可以聚合的语言。

<image>元素是控制blog的外观模式的。其中<title>元素的内容是用浏览器显示时需要点击的替代文本;<url>元素的内容是需要链接到的地址;<link>中的内容是该网页所在网站的首页地址。

<link>元素中内容是该网页的网址。

<Item>元素也是RSS必须的元素,它的子元素主要有<title><link><description>。属性about中内容是该项目对应的网址。同样<title>中的内容是项目的标题;<link>中的内容和about属性规定的内容一致,指链接该项目的地址;<description>中的内容是显示在网页上的文章的提要,用户获想详细了解文章内容可点击"阅读全文"。而文档中我们举了两个<Item>的例子,第二个是图片,它的 <description>中的内容是上传图片存放的地址。

RSS中还有其它的一些元素这里没有涉及到,例如<textinput>元素使用有点神秘感,可以用它来确定一个搜索引擎,但是大多数的聚合器都没有做这一点。它的子元素<title><description><name><link>都是必须的,前三种元素的使用和前面的基本类似,<link>中的内容是能够执行处理输入请求的URL

还有一些元素不经常使用,有兴趣的读者可以参考http://blogs.law.harvard.edu/tech/rss#sampleFiles

感谢blog网友,是他们在网上对blogRSS方面论述使我对这方面的知识有了一定了解。

参考资料
http://www.blogchina.com/
http://web.resource.org/rss/1.0/spec#s5.1
http://www.kantianxia.com/reader/rss.html
http://www.yourblog.org/Data/20042/3345.html
http://www.yourblog.org/Data/200312/1.html
http://www.meansys.com/blog/CommList.aspx?BlogLogCode=1000101756
http://blog.china-pub.com/bloginfo.htm
http://www.blogchina.com/new/display/49197.html
http://www.yangjiasen.blogchina.com/
http://www.blogchina.com/new/source/288.html
http://www.blogchina.com/new/display/32658.html
http://taolihui.blogchina.com

//======+++++++++++++++++++++++++++++++++++++=========
=====================================================

4.什么是Atom

Atom HomePage: [WWW]http://www.atomenabled.org/

Atom WiKi: [WWW]http://www.intertwingly.net/wiki/pie/FrontPage 

//==============================================
//=====++++++++++++++++++++++++++++=============

内容:
创建 Web 资源
Atom 发现
Atom 提要
结束语
参考资料
关于作者
对本文的评价
相关内容:
用于 Python 的 RSS
从远程 RSS 文件抓取标题
Web 服务梦想家
最初作为 RSS 替代品, Atom 演变成会话式 Web 的核心

RSS
之争在 XML 社区中人所共知。Netscape 把这种轻量级的格式拼凑在一起用于连锁,即把网站中传输的信息聚集到门户中。由于从这个低调的起点开始,甚至连这个缩写词的含义也受到了争议。Weblogs 和下一代门户已经使 Web 资源描述的交换成为一种普遍而重要的现象。各种流派的 RSS 统治着元数据交换的世界,无休无止的 RSS 纷争增加了风险。

长期卷入这场冲突的一位知名技术专家是 IBM Emerging Technology Group 的 Sam Ruby。2003 年中期,Ruby 提议 RRS 及相关连锁格式的各方面的专家和用户共同合作开发下一代格式。部分目的是建立一个顾及各种派别的标准,从而平息 RSS 纷争。另一个目标是建立技术上更加完善的设计来代替不同的 RSS 风格,根据很多 RSS 用户的实践经验对这种实用的设计进行折衷,使新的格式与 Web 的体系结构和文化协调一致。大批开发人员和作者争相加入该项目,显然是因为对 RSS 中无休无止的硝烟和阴谋感到失望,期望对所讨论的技术问题出现一种新的解决方法。

该项目最初称为 Echo,但由于商标问题而更名为 Atom。如 Atom Wiki 所宣称的那样,该项目要建立“连锁、存档和编辑情节式站点的规范”。我认为,Atom 处理领域的定义特征不仅仅是自然分解成情节的 Web 站点,还包括那些与其他站点交互中具有会话性质的 Web 站点。情节往往带有对其他站点上类似实体的交叉索引,Atom 就是为了把这类交换粘结在一起。

Atom 令人瞩目有很多原因,最突出的一点是尽管作为一种社区规范,作为有史以来组织最为庞大的委员会磋商的结果,它仍保持了简单性。Atom 包括 Syndication Format Specification(连锁格式规范)(目前为 0.3 版,草案 2),它是表示 Web 资源信息的 XML 格式;和 API Specification(API 规范)(目前为 0.9 版),基于 HTTP 检索和修改 Web 资源信息的一些约定。虽然目前只有 API 规范正式提交给了Internet 工程任务组(IETF),这两种规范都采用 Internet Draft 的格式编写,以期最终成为 RFC 标准。除了 XML 语法之外,Atom 还使用 Web Ontology Language (OWL) 开发了 RDF 形式。本文中对 Atom 的介绍主要放在 XML 格式规范上,但在适当的地方也会涉及到 API。所有的 Atom 规范仍在积极地开发之中,在标准化之前还可能发生变化,虽然基本的 Atom 风格很可能不变。

//======+++++++++++++++++++++++++++++============
//===============================================
上述对atom的叙述摘自Thinking XML: 使用 Atom 格式连锁新闻及其他内容. 由于篇幅挺长的,这里就不再贴出了,想详细了解就看看这篇来自的IBM开发者Thinking XML: 使用 Atom 格式连锁新闻及其他内容.文章吧。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值