目录
WWW
互联网的蓬勃发展
万维网(WWW, World Wide Web)是将互联网中的信息以超文本形式展现 的系统。也叫做Web。可以显示WWW信息的客户端软件叫做Web浏览器。目 前人们常用的Web浏览器包括微软的Internet Explorer、Mozilla基金会的Firefox、 Google公司的Google Chrome、Opera软件公司的Opera以及Apple公司的Safari等。
借助浏览器,人们不需要考虑该信息保存在哪个服务器,只需要轻轻点击鼠 标就可以访问页面上的链接并打开相关信息。
通过浏览器进行访问后回显在浏览器中的内容叫做"Web页"(或WWW页)。
公司或学校等组织以及个人的Web页被称作主页。在日本,很多公司的主页地址 形式如下:
http: //www. 公司名称. co. jp/
这一类主页当中通常会发布公司概况、产品信息、招贤纳士等内容。人们可 以通过点击这些标题的图标或链接就可以跳到对应的页面上。而这些页面上所提 供的信息不仅仅是文字内容,还有图片或动画乃至声音或其他程序等各式各样的 信息。此外,通过Web页不仅可以获取信息,还可以通过自己制作Web页来向全 世界发布信息。
WWW基本概念
WWW定义了3个重要的概念,它们分别是访问信息的手段与位置(URI, Uniform Resource Identifier)、信息的表现形式(HTML, HyperText Markup Language) 以及信息转发(HTIP , HyperText Transfer Protocol)等操作。
URI
URI是Uniform Resource Identifier的缩写,用于标识资源。URI是一种可以用 于WWW之外的高效的识别码,它被用于主页地址、电子邮件、电话号码等各种 组合中。如下所示:
http: //www. rfc-editor. org/rfc/rfc4395. txt
http: //www. ietf. org: 80/index. html
http : / /localhost : 631/
这些例子属于一般主页地址,也被叫做URL (Uniform Resource Locator)。
URL常被人们用来表示互联网中资源(文件)的具体位置。
但是URI不局限于标 识互联网资源,它可以作为所有资源的识别码。现在,在有效的RFC文档中,已 经不再使用URL, 转而在使用URI。相比URL狭义的概念,URI则是一个广义 的概念。因此,URI可以用于除了WWW之外的其他应用协议中。
URI所表示的组合叫方案(Scheme)。在众多URI的Scheme中WWW主要 用其中的http和https表示Web页的位置和访问Web页的方法。
URI的http方案的具体格式如下:
http://主机名/路径
http://主机名:端口号/路径
http://主机名:端口号/路径?访问内容#部分信息
其中主机名表示域名或IP地址,端口号表示传输端口号。省略端口号时,则表示采用http的默认端口80。路径是指主机上该信息的位置,访问内容表示要传给CGI的信息,部分信息表示 页面当中的位置等。
这种表示方法可以唯一地标识互联网中特定的数据。不过,由于用http方案 展现的数据随时都有可能发生变化,所以即使将自己喜欢的页面的URI (URL) 记住,也不能保证下次是否还能够访问到该页。
HTML
HTMP是记述Web页的一种语言(数据格式)。它可以指定浏览器中显示的文字、文字的大小和颜色。此外,不仅可以对图像或动画进行相关设置,还可以设置音频内容。
HTML具有纯文本的功能。在页面中不仅可以为文字或图像附加链接,当用户点击那些链接时还可以呈现该链接所指示的内容,因此它可以将整个互联网中任何一个www服务器中的信息以链接的方式展现。绝大多数互联网中的Web页,都以链接的形式指向关联的其他信息。逐一点开这些链接就可以了解全世界的信息。
HTML也可以说是www通用的数据表现协议。即使是在异构的计算机上,只要是可以用HTML展现的数据,那么效果基本上是一致的。如果把它对应到 OSI参考模型,那么可以认为HTML属于www的表示层。不过,鉴于现代计算机网络的表示层尚未完全准备就绪,根据操作系统和所用软件的不同,最终表现出来的效果也可能会出现细微差别。
图展示了一个通过HTML表现数据样本的例子。如果将其用浏览器(例如Firefox)打开的话,效果如图所示。