1. Web服务器的工作原理
我们平时浏览网页的时候,会打开浏览器,输入网址后按下回车键,然后就会显示出你想要浏览的内容。在这个看似简单的用户行为背后,到底隐藏了些什么?
对于普通的上网过程,系统其实是这样做的:浏览器本身是一个客户端,当你输入URL
的时候,浏览器首先会去请求DNS
服务器,通过DNS
获取相应域名对应的IP
,然后通过IP
地址找到IP
对应的服务器后,要求建立TCP
连接,等浏览器发送完HTTP Request
(请求)包后,服务器接收到请求包之后开始处理请求包,服务器调用自身服务,返回HTTP Response
(响应)包;客户端收到来自服务器的响应后开始渲染这个Response
包里的主体(body
),等收到全部的内容,随后断开与该服务器之间的TCP
连接。
一个Web
服务器也被称为HTTP
服务器,它通过HTTP
协议与客户端通信。这个客户端通常指的是Web
浏览器(其实手机客户端内部也是浏览器实现的)。
Web
服务器的工作原理可以简单地归纳如下:
- 客户端通过
TCP/IP
协议建立到服务器的TCP
连接; - 客户端向服务器发生
HTTP
协议请求包,请求服务器里的资源文档; - 服务器向客户机发送
HTTP
协议应答包,如果请求的资源包含有动态语言的内容,那么服务器会调用动态语言的解释引擎负责处理“动态内容”,并将处理得到的数据返回给客户端; - 客户端与服务器断开。由客户端解释
HTML
文档,在客户端屏幕上渲染图形结果。
一个简单的HTTP
事务就是这样实现的,看起来复杂,原理其实是挺简单的。需要注意的是客户端与服务器之间的通信是非持久连接的,当服务器发送了应答后就与客户端断开连接,等待下一次请求。
2. URL和DNS解析
我们浏览网页都是通过URL
实现的,那么URL
到底是怎么样的?
URL(Uniform Resource Locator)
是统一资源定位符的英文缩写,用于描述一个网络上的资源,基本格式如下:
scheme://host[:port#]/path/.../[?query-string][#anchor]
scheme 指定底层使用的协议(例如HTTP, HTTPS, FTP)
host HTTP服务器的IP地址或者域名
port# HTTP服务器的默认端口是80,这种情况下端口号可以省略,如果使用了别的端口,必须指明
path 访问资源的路径
query-string 发送给HTTP服务器的数据
anchor 锚
DNS(Domain Name System)
是域名系统的英文缩写,是一种组织成域层次结构的计算机和网络服务命名系统,它用于TCP/IP
网络,它从事将主机名或域名转换为实际IP
地址的工作。
详细DNS解析过程如下:
- 在浏览器中输入www.qq.com域名,操作系统会先检查自己本地的hosts文件是否有这个网址映射关系,如果有,就先调用这个IP地址映射,完成域名解析;
- 如果hosts里没有这个域名映射,则查找本地DNS解析器缓存,是否有这个网址映射关系,如果有,直接返回,完成域名解析;
- 如果hosts与本地DNS解析器缓存都没有相应的网址映射关系,首先会找TCP/IP参数中设置的首选DNS服务器,在此我们叫它本地DNS服务器,此服务器收到查询时,如果查询的域名包含在本地配置区域资源中,则返回解析结果给客户机,完成域名解析,此解析具有权威性;
- 如果要查询的域名,不由本地DNS服务器区域解析,但该服务器已缓存了此网址映射关系,则调用这个IP地址映射,完成域名解析,此解析不具有权威性;
- 如果本地DNS服务器本地区域文件与缓存解析都失效,则根据本地DNS服务器的设置(是否设置转发器)进行查询,如果未用转发模式,本地DNS就把请求发至“根DNS服务器”,“根DNS服务器”收到请求后会判断这个域名(.com)是谁来授权管理的,并会返回一个负责该顶级域名解析器的一个IP.本地DNS服务器收到IP信息后,将会联系负责.com域的这台服务器。这台负责.com域的服务器收到请求后,如果自己无法解析,它就会找一个管理.com域的下一级DNS服务器地址(qq.com)给本地DNS服务器。当本地DNS服务器收到这个地址后,就会找qq.com域服务器,重复上面的动作,进行查询,直到找到www.qq.com主机;
- 如果用的是转发模式,此DNS服务器就会把请求转发至上一级DNS服务器,由上一级服务器进行解析,上一级服务器如果不能解析,找根DNS或把请求转至上一级,以此循环。不管是本地DNS服务器是否使用转发,还是根提示,最后都是把结果返回给本地DNS服务器,由此DNS服务器再返回给客户机。
所谓“递归查询过程”就是“查询的递交者”更替,而“迭代查询过程”则是“查询的递交者”不变。