《图解HTTP》第一章个人学习思考

第一章 了解Web及其网络基础
1.1使用HTTP协议访问Web
1.2HTTP的诞生
1.3网络基础TCP/IP
1.4和HTTP相关协议:IP\TCP和DNS
1.5负责域名解析的DNS服务
1.6各种协议和HTTP协议的关系
1.7URI和URL
——————————————————
心得:
HTTP为知识共享而诞生的协议,属于TCP/IP协议族里的协议之一。
我们浏览web时候web是如何实现的?数据怎么传的?网络是如何通信的呢?

利用 TCP/IP 协议族进行网络通信时,会通过分层顺序与对方进行通信。发送端从应用层往下走,接收端则往应用层往上走。
HTTP这个应用层协议和其他层的协议之间是什么一种关系?

1.1使用HTTP协议访问Web

网页浏览器(Web Browser)的地址里输入URL,web页面如何呈现?
根据web浏览器制定的地址栏的url,从浏览器向服务器端获取文件资源等信息,从而显示在web页面。
在这里插入图片描述
Web 使用一种名为 HTTP(HyperText Transfer Protocol,超文本传输协议 )的协议作为规范,完成从客户端到服务器端等一系列运作流程。而协议是指规则的约定。

1.2 HTTP诞生

1989 年 3 月,互联网还只属于少数人。在这一互联网的黎明期,HTTP 诞生了。CERN(欧洲核子研究组织)的蒂姆 • 伯纳斯 - 李(Tim BernersLee)博士提出了一种能让远隔两地的研究者们共享知识的设想。最初设想的基本理念是:借助多文档之间相互关联形成的超文本(HyperText),连成可相互参阅的 WWW(World Wide Web,万维网)。现在已提出了 3 项 WWW 构建技术,分别是:把 SGML(Standard Generalized Markup Language,标准通用标记语言)作为页面的文本标记语言的 HTML(HyperText Markup Language,超文本标记语言);作为文档传递协议的 HTTP ;指定文档所在地址的 URL(Uniform Resource Locator,统一资源定位符)。
HTTP/0.9
HTTP 于 1990 年问世。那时的 HTTP 并没有作为正式的标准被建立。现在的 HTTP 其实含有 HTTP1.0 之前版本的意思,因此被称为HTTP/0.9。
HTTP/1.0
HTTP 正式作为标准被公布是在 1996 年的 5 月,版本被命名为HTTP/1.0,并记载于 RFC1945。虽说是初期标准,但该协议标准至今仍被广泛使用在服务器端。
HTTP/1.1
1997 年 1 月公布的 HTTP/1.1 是目前主流的 HTTP 协议版本。当初的标准是 RFC2068,之后发布的修订版 RFC2616 就是当前的最新版本。

1.3 网络基础TCP/IP

TCP/IP 协议族
计算机与网络设备要相互通信,双方就必须基于相同的方法。比如,如何探测到通信目标、由哪一边先发起通信、使用哪种语言进行通信、怎样结束通信等规则都需要事先确定。不同的硬件、操作系统之间的通信,所有的这一切都需要一种规则。而我们就把这种规则称为协议(protocol)。
TCP/IP 是互联网相关各类协议族的总称
**协议中存在各式各样的内容。**从电缆的规格到 IP 地址的选定方法、寻找异地用户的方法、双方建立通信的顺序,以及 Web 页面显示需要处理的步骤,等等。
在这里插入图片描述
TCP/IP分层管理
TCP/IP 协议族按层次分别分为以下 4 层:应用层、传输层、网络层和数据链路层。

TCP/IP 层次化是有好处的。

  1. 如果互联网只由一个协议统筹,某个地方需要改变设计时,就必须把所有部分整体替换掉。而分层之后只需把变动的层替换掉即可。把各层之间的接口部分规划好之后,每个层次内部的设计就能够自由改动了。
  2. 设计网络时候,从各个层逐一设置。

应用层:
应用层决定了向用户提供应用服务时通信的活动。TCP/IP 协议族内预存了各类通用的应用服务。比如,FTP(File Transfer Protocol,文件传输协议)和 DNS(Domain Name System,域名系统)服务就是其中两类。HTTP 协议也处于该层。


传输层:
传输层对上层应用层,提供处于网络连接中的两台计算机之间的数据传输。在传输层有两个性质不同的协议。TCP(Transmission Control Protocol,传输控制协议)和 UDP(User Data Protocol,用户数据报协议)。


网络层(网络互连层):
网络层用来处理在网络上流动的数据包。数据包是网络传输的最小数据单位,该层规定了通过怎样的路径(所谓的传输路线)到达对方计算机,并把数据包传送给对方。
和对方计算机之间通过多台计算机或网络设备进行传输时,网络层所起的作用就是在众多的选项内选择一条传输路线。


链路层(又名数据链路层,网络接口层)
用来处理连接网络的硬件部分。包括控制操作系统、硬件的设备驱动、NIC(Network Interface Card,网络适配器,即网卡),及光纤等物理可见部分(还包括连接器等一切传输媒介)。硬件上的范畴均在链路层的作用范围之内。

在这里插入图片描述

利用 TCP/IP 协议族进行网络通信时,会通过分层顺序与对方进行通信。发送端从应用层往下走,接收端则往应用层往上走。

HTTP举例
1、作为发送端的客户端在应用层(HTTP协议)发出想看某个Web页面的HTTP请求。
2、在传输层(TCP协议)(HTTP请求报文)进行分割,并在各个报文上打上标记序号及端口号转发给网络层。
3、在网络层(IP协议),增加作为通信目的地的MAC地址后转发给链路层。
4、接收端的服务器在链路层接收到数据,按顺序往上层发送,一直到应用层,当传输到应用层,才真正接收到由客户端发送来的HTTP请求。
在这里插入图片描述

1.4 与 HTTP 关系密切的协议 : IP、TCP 和DNS

协议及其对应的层:
HTTP协议/DNS协议,应用层
TCP协议,传输层
IP协议,网络层

1.4.1 负责传输的IP协议

IP(Internet Protocol,因特网协议),网际协议位于网络层。TCP/IP协议族里的IP指的就是网际协议,“IP”和“IP 地址”别搞混,“IP”其实是一种协议的名称。
**IP协议作用——把各种数据包传送给对方。保证确实传送到对方那里。 **

问题:如何做到正确的传输给对方它所需要的数据呢?

  1. 第一个条件:IP地址
  2. 第二个条件:MAC地址(Media Access Control Address)

IP地址指明节点被分配到的地址,MAC地址是指网卡所属的固定地址。IP地址和MAC地址进行配对。IP地址可变换,但是MAC地址基本上不改变。(使用 ARP 协议凭借 MAC 地址进行通信)

**IP间的通信依赖MAC地址。**在网络上,通信的双方在同一局域网(LAN)内的情况是很少的,通常是经过多台计算机和网络设备中转才能连接到对方。而在进行中转时,会利用下一站中转设备的 MAC地址来搜索下一个中转目标。这时,会采用 ARP 协议(AddressResolution Protocol)。ARP 是一种用以解析地址的协议,根据通信方的 IP 地址就可以反查出对应的 MAC 地址。

在到达通信目标前中转过程里,计算机和路由器等网络设备获悉传输路线的机制称为路由选择。(routing) 帮助记忆:寄件人发件,快递公司收件到货物集散中心然后派件中转,达到收件人所在区域在层层分发直到到达地址。
在这里插入图片描述
1.4.2 确保可靠性的TCP协议
按层次分,TCP 位于传输层,提供可靠的字节流服务
字节流服务(Byte Stream Service)是指,为了方便传输,将大块数据分割成以报文段(segment)为单位的数据包进行管理。而可靠的传输服务是指,能够把数据准确可靠地传给对方。一言以蔽之,TCP 协议为了更容易传送大数据才把数据分割,而且 TCP 协议能够确认数据最终是否送达到对方。

如何实现数据包传输到正确的目标呢?

  1. 字节流服务方便传输
  2. 三次握手(three-way handshaking)策略。
    用 TCP 协议把数据包送出去后,TCP不会对传送后的情况置之不理,它一定会向对方确认是否成功送达。握手过程中使用了 TCP 的标志(flag) —— SYN(synchronize) 和ACK(acknowledgement)
  3. 其他手段

在这里插入图片描述

发送端首先发送一个带 SYN 标志的数据包给对方。接收端收到后,回传一个带有 SYN/ACK 标志的数据包以示传达确认信息。最后,发送端再回传一个带 ACK 标志的数据包,代表“握手”结束。若在握手过程中某个阶段莫名中断,TCP 协议会再次以相同的顺序发送相同的数据包。

1.5 负责域名解析的DNS服务

DNS(Domain Name System)服务是和HTTP协议一样位于应用层的协议,是提供域名到IP地址时间的解析服务。

DNS协议提供通过域名查找IP地址,或者逆向从IP地址反查域名的服务。

计算机可以被赋予IP地址,也可以被赋予主机名和域名。**用户通常使用主机名或域名来访问对方的计算机,**而不是直接通过 IP地址访问。因为与 IP 地址的一组纯数字相比,用字母配合数字的表示形式来指定计算机名更符合人类的记忆习惯。计算机通常通过纯数字的IP地址来访问

在这里插入图片描述

1.6 各种协议和HTTP协议的关系

IP 协议、TCP 协议和 DNS 服务在使用HTTP 协议的通信过程中各自发挥了哪些作用?
在这里插入图片描述

1.7 URI和URL

URI,统一资源标识符
URL,统一资源定位符
URI是用字符串标识的某一互联网资源,URL表示资源的地点(互联网上所处的位置),URL是URI的子集。

1.7.1 URI——Uniform Resource Identifier
Uniform:规定统一的格式可方便处理多种不同类型的资源,而不是根据上下文环境来识别资源指定的访问方式。
Resource:定义“可识别的任何东西”,除了文档文件、图像或服务(如当天天气预报)外可以区别于其他类型的,全都可作为资源。
Identifier:表示可标识的对象,也称为标识符。
URI 就是由某个协议方案表示的资源的定位标识符。协议方案是指访问资源所使用的协议类型名称。

1.7.2 URI格式
表示指定的URI,要使用涵盖全部必要信息的绝对URI、绝对URL以及相对URL.
相对URL是指从浏览器中基本URI处指定的URL,如/image/logo.gif。
在这里插入图片描述

http: 或 https: 等协议方案名获取访问资源时要指定协议类型。不区分字母大小写,最后附一个冒号(:)。
1、登入信息(认证)指定用户名和密码作为从服务端获取资源时必要的登入信息(身份认证)
2、服务器地址:使用绝对URI必须指定访问的服务器地址。地址可以是类似hackr.jp 这种 DNS 可解析的名称,或是 192.168.1.1 这类 IPv4 地址名,还可以是 [0:0:0:0:0:0:0:1] 这样用方括号括起来的 IPv6 地址名。
3、服务器端口号:
指定服务器连接的网络端口号。是可选项,用户省略则自动使用默认端口号。
4、带层次的文件路径:
指定服务器上的文件路径来定位特指的资源。
5、查询字符串:
针对已指定的文件路径内的资源,可以使用查询字符串传入任意参数,此项可选。
6、片段标识符
使用片段标识符通常可标记处已获取资源里的子资源(文档内的某个位置)。但在 RFC 中并没有明确规定其使用方法。该项也为可选项。

RFC(Request for Comments,征求修正意见书)

通常,应用程序会遵照由 RFC 确定的标准实现。可以说,RFC 是互联网的设计文档,要是不按照 RFC 标准执行,就有可能导致无法通信的状况。比如,有一台 Web 服务器内的应用服务没有遵照RFC 的标准实现,那 Web 浏览器就很可能无法访问这台服务器了。
由于不遵照 RFC 标准实现就无法进行 HTTP 协议通信,所以基本上客户端和服务器端都会以 RFC 为标准来实现 HTTP 协议。但也存在某些应用程序因客户端或服务器端的不同,而未遵照 RFC 标准,反而将自成一套的“标准”扩展的情况。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值