万维网是如何工作的?

让我们认真看看万维网的技术组件和机制,首先从URL和HTTP开始。
假设打开你喜欢的浏览器浏览一个简单的网页。页面中有些文字可能是蓝色的并带有下划线。用鼠标点击这些文字,当前页面就会被蓝色文本链接到的新页面替换。这样相互链接的页面就叫超文本(意思是“不仅仅是文本”)。超文本实际上是个老概念,但浏览器把它带到每个人面前。
假设某个链接的提示是“W3C主页”,当你把鼠标移到该链接上,浏览器窗口底部的状态栏就会显示链接指向的URL,如http://w3.org,域名之后也许还有进一步的信息。
当你点击链接,浏览器就会打开一个连接到w3.org域的80端口的TCP/IP连接,然后发送HTTP请求,获取URL中域名后面部分指定的信息。例如,如果链接是http://w3.org/index.html,那么请求的就是w3.org服务器上的index.html文件。
收到请求后,w3.org服务器首先判断需要做什么。如果客户端请求获取的是服务器上的文件,服务器就将该文件发送回去,由客户端,也就是你的浏览器,显示出来。服务器返回的文本绝大多数都是HTML格式的,其中包含实际内容和如何显示这些内容的格式信息。
在实际场景中,可能就这么简单,但通常还有更多内容。HTTP协议规定,浏览器可以在客户端请求中增加若干附加信息。服务器返回的结果中通常也会包括额外几行信息,指明返回数据的长度和类型。
URL自身编码了信息。第一部分“http”是协议名,可能采用好几种协议。最常见的是HTTP,你也将看到其他协议,包括“file”表示信息来自本机(而不是Web上),“https”表示采用经过加密的HTTP协议的安全版本,稍后我们将介绍该协议。
接下来,“://”后面是域名,即服务器的名字。域名后面可以跟着斜线(/)和一串字符。该字符串会原样传递给服务器,由服务器决定如何处置。最简单的情况是域名后什么都没有,连斜线也没有。在这种情况下,服务器将返回默认页面,比如index.html。如果域名后有文件名,就返回其对应文件的内容。文件名之后如果有问号,一般表示问号前面的部分是程序,意味着希望服务器运行该程序,并将问号后面部分作为参数传给该程序。这就是服务器处理网页表单信息的一种方式。你可以用Bing搜索来验证,比如在浏览器的地址栏里输入下面的URL:

39748028e9a342ec8f5a0c83d43e46cf.png

 域名之后的文本采用的字符必须在某个字符集中,这个字符集里不包含空格和大多数非字母数字字符。因此需要对这些字符进行编码。用加号(+)来表示空格,用前面冠以百分号(%)的两个十六进制数字编码表示其他字符。例如下面的URL片段5%2710%22%2D6%273%22表示5'10"-6'3"。因为十六进制27是单引号字符,十六进制22是双引号字符,而十六进制2D是减号。

 

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值