46、万维网之一(应用层)

引言

  • Web 是万维网( World Wide Web )的俗称,它是一个体系结构框架。该框架把分布在整个Internet 数百万台机器上的内容链接起来供人们访问。Web 刚出现时在瑞士被科研人员用来相互之间协同设计高能物理实验,仅十年间它就演变成今天被数百万人认为的“ Internet ”应用。Web 诞生于1989 年的欧洲原子能研究中心CERN。最初的想法是帮助大型研究组成员通过修改报告、计划、绘图、照片和其他文档的方式来进行合作,这些文档由粒子物理实验产生,并且研究组的成员通常分散在好几个国家或好几个时区。将文档链接成Web 的提议由CERN 物理学家Tim Berners-Lee 提出, 18 个月后第一个(基于文本的)原型系统投入运行。该系统的公开文档发表在Hypertext’ 91 会议,它立即引起了另一个研究组的注意,该研究组由伊利诺伊大学的Marc Andreessen 领导,他最终开发了第一个图形浏览器。这就是Mosaic 浏览器,正式发布于1993.2。正如他们所说的,其余的现在己经成为历史。Mosaic 是如此的受欢迎,一年后Andreessen 离开学校组建了网景通信公司,公司目标是开发Web 软件。接下来的3 年,网景的Netscape Navigator 和微软的IE 浏览器进入了一场浏览器大战,每一个都试图捕捉这个新兴市场的更大份额,为此疯狂地加入比对手更多的功能(而且导致了更多的错误〉。
  • 从20 世纪90 年代到本世纪初,网站和网页(称为Web 内容〉成指数倍地增长,直到达到具有数百万计网站和数十亿网页的规模。这些网站中的一小部分盛极一时,网站和它们背后的公司主要定义了Web,正如今天人们所体验的那样。这些公司包括书店(亚马逊于1994 年成立,市值500 亿美元〉、跳蚤市场(易趣, 1995 成立,市值300 亿美元)、搜索(谷歌, 1998 成立,市值150 亿美元〉和社会网络( Facebook, 2004 成立,私人公司,价值超过150 亿美元〉。到2000 年期间,许多Web 公司一夜之间晋升数百万美元身价,当最后表明原来一切都只是炒作时,几乎接近破产。这一切甚至还有一个特殊名称,即所谓的点com 时代( dot com era )。新的想法仍然丰富着Web 世界。许多新想法来自年轻的学生。例如,当Mark Zuckerberg 开始创建Facebook 时是哈佛大学的学生: Sergey Brin 和Larry Page 创建Google 时是斯坦福大学的学生。
  • 1994 年, CERN 和MIT 签署了建立万维网联盟( W3C, World Wide Web Consortium)的协议。W3C 是一个组织,它致力于进一步开发Web 、对协议进行标准化,并鼓励站点之间实行互操作。Bemers-Lee 担任了联盟的主管。从那时起,己经有几百所大学和公司加入了该联盟。尽管现在关于Web 的书籍数不胜数,但获取关于Web 最新信息的最佳之处(很自然地〉还是在Web 本身。W3C 联盟的主页是 www.w3.org ,感兴趣的读者可以从那里找到涵盖该联盟所有文档和活动的页面链接。

1、体系结构概述

  • 站在用户的角度看, Web 由大量分布在全球范围的内容组成,这些内容以Web 页面(Web page )或简称为页面( page )的形式表示。每个页面可以包含指向其他页面的链接,这些页面可以分布在全球任何地方。用户单击一个链接就可以跟随这个链接来到它所指向的页面。这个过程可无限地重复下去。让一个页面指向另一个页面的想法现在称为超文本( hypertext ),这种想法在1945 年由一个卓有远见的MIT 电子工程系教授Vannevar Bush 发明( Bush, 1945 ),也就是说早在Internet 被发明出来之前就已经有了Web 。事实上,它在商业计算机之前就己经存在了,虽然几所大学生产出来的粗糙原型机能填满大型会议室,而且能力还不及一个现代化的袖珍计算器。
  • 通常观看页面的程序称为浏览器( browser )。Firefox, Internet Explorer 和Chrome 是比较流行的浏览器。浏览器取回所请求的页面,对页面内容进行解释,并在屏幕上以恰当的格式显示出来。页面内容本身可能是文本、图像和格式化的命令混合体,表现的形式多种多样:可以表现成传统的文档形式,或者表现成其他内容的形式(比如视频〉,或者是一个能产生图形界面的程序,用户通过该界面实行与网页的交互方式。
  • 页面的照片如图左边一般所示。这是华盛顿大学计算机科学与工程系的一个页面。这个页面显示了文本和图形元素(大多数内容太小无法阅读〉。页面中的某些部分与指向其他页面的链接有关。与另一个页面相关的一小段文字、一个图标、一个图像等都称为超链接( hyperlink )。为了跟随一个链接,用户将鼠标光标放在页面区域的链接部分(这会使光标发生变化),然后单击链接。点击链接只是告诉浏览器去获取另一个页面的简单方式。在Web 初期,链接通过下划线和彩色文本来突出强调,以便使它们脱颖而出。如今, Web 页面的创作者己经有各种方法来控制链接区域的外表,因此一个链接可能会作为一个图标出现,或当鼠标滑过它时改变外观。正是页面的创造者使得链接在视觉上表现鲜明,从而提供了一个可用的接口。在这里插入图片描述
  • 系里的学生跟随一个链接到一个特别为他们而设计内容的页面,能学到更多东西。通过点击圈起来的区域就可以访问该链接。然后,浏览器抓取新的一页并显示出来,如图左下角所示的那部分。除了这个例子外,第一页还包含着指向数十个其他网页的链接。页面显示背后的基本工作模型如图所示。在这里,客户机器上的浏览器正在显示一个Web 页面。每一页的抓取都是通过发送一个请求到一个或多个服务器,服务器以页面的内容作为响应。抓取网页所用的“请求-响应”协议是一个简单的基于文本协议,它运行在TCP 之上,就像SMTP 一样。这个协议就是所谓的超文本传输协议( HTTP, HyperText Transfer Protocol )。内容可能只是一个磁盘读取的文档,或者是数据库查询和程序执行的结果。如果每次显示的是相同的一个文档,则称该网页为静态页面( static page )。相反,如果每次显示的是程序按需产生的内容,或者页面本身包含了一个程序,则称该网页为动态页面(dynamic page )。
  • 一个动态的页面每次显示时本身表现可能是不同的。例如,电子商店的首页可能对每个访问者显示的内容不尽相同。如果一个书店的顾客在过去买了一些推理小说,那么当这位顾客访问商店的主页后,可能会看到突出显示的新的惊悚小说,而另一位更喜欢烹饪的顾客可能首先映入眼帘的是新的烹饪书籍。网站如何跟踪哪位顾客喜欢什么我们马上就会说明。简单地说,其答案涉及一种Cookie。
  • 在图中,浏览器接触三个服务器获取了两个页面,这三个服务器分别是edu.cs. washington 、youtube.comgoogle-analytics.com。来自这些不同服务器的内容集成在一起通过浏览器显示。显示细化了网页处理的范围,主要取决于什么样的内容。除了渲染文字和图形外,它可能还涉及播放一段视频,或者运行一个脚本把作为页面一部分的用户界面呈现出来。在这种情况下, cs.washington.edu 服务器提供了主网页, youtube.com 服务器提供了一段嵌入的视频,而 google-analytics.com 服务器没有提供任何用户可见的内容,但它追踪访问网站的用户。我们稍后将详细讨论跟踪器。

客户端

  • 现在让我们来看图中Web 浏览器这边的详细
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值