一. 网络发展史
独立模式:计算机之间相互独立
网络互连:
随着时代的发展,越来越需要计算机之间互相通信,共享软件和数据,即以多个计算机协同工作来完成业务,就有了网络互连。
网络互连:将多台计算机连接在一起,完成数据共享。
数据共享本质是网络数据传输,即计算机之间通过网络来传输数据,也称为网络通信。
根据网络互连的规模不同,可以划分为局域网和广域网。
局域网LAN:
局域网,即 Local Area Network,简称LAN。
Local 即标识了局域网是本地,局部组建的一种私有网络。
局域网内的主机之间能方便的进行网络通信,又称为内网;局域网和局域网之间在没有连接的情况下,是无法通信的。
局域网组建网络的方式有很多种:
- 基于网线直连
- 基于交换机组建
- 基于交换机和路由器组建
- 交换机:把多个机器连接到一个局域网中
- 路由器:连接多个局域网
- 其实还有集线器,但是集线器比较特殊,它的功能非常有限,所以现在组网的时候很少看到了。
在交换机和路由器反复连接之下,就可以把很多很多的设备都连接在一起,使他们可以直接通信。当机器足够多的时候,就可以成为 " 广域网 "。广域网和局域网之间没有明确的界限。
广域网WAN
广域网,即 Wide Area Network,简称WAN。
通过路由器,将多个局域网连接起来,在物理上组成很大范围的网络,就形成了广域网。广域网内部的局域网都属于其子网。
二. 网络通信基础
网络互连的目的是进行网络通信,也即是网络数据传输,更具体一点,是网络主机中的不同进程间,基于网络传输数据。
那么,在组建的网络中,如何判断到底是从哪台主机,将数据传输到那台主机呢?这就需要使用IP地址来标识。
1. IP地址
IP地址主要用于标识网络主机、其他网络设备(如路由器)的网络地址。简单说,IP地址用于定位主机的网络地址。
就像我们发送快递一样,需要知道对方的收货地址,快递员才能将包裹送到目的地。
格式:
IP地址是一个32位的二进制数,通常被分割为4个“8位二进制数”(也就是4个字节),如:
01100100.00000100.00000101.00000110。
通常用“点分十进制”的方式来表示,即 a.b.c.d 的形式(a,b,c,d都是0~255之间的十进制整数)。如:100.4.5.6。
特殊IP:
127.*的IP地址用于本机环回(loop back)测试,通常是127.0.0.1
本机环回主要用于本机到本机的网络通信(系统内部为了性能,不会走网络的方式传输),对于
开发网络通信的程序(即网络编程)而言,常见的开发方式都是本机到本机的网络通信。
IP地址解决了网络通信时,定位网络主机的问题,但是还存在一个问题,传输到目的主机后,由哪个进程来接收这个数据呢?这就需要端口号来标识。
2. 端口号
概念:
在网络通信中,IP地址用于标识主机网络地址,端口号可以标识主机中发送数据、接收数据的进程。简单说:端口号用于定位主机中的进程。
类似发送快递时,不光需要指定收货地址(IP地址),还需要指定收货人(端口号)
格式:
端口号是0~65535范围的数字,在网络通信中,进程可以通过绑定一个端口号,来发送及接收网络数据。
注意事项:
两个不同的进程,不能绑定同一个端口号,但一个进程可以绑定多个端口号。
问题:
有了IP地址和端口号,可以定位到网络中唯一的一个进程,但还存在一个问题,网络通信是基于二进制0/1数据来传输,如何告诉对方发送的数据是什么样的呢?
网络通信传输的数据类型可能有多种:图片,视频,文本等。同一个类型的数据,格式可能也不同,如
发送一个文本字符串“你好!”:如何标识发送的数据是文本类型,及文本的编码格式呢?
基于网络数据传输,需要使用协议来规定双方的数据格式。
3. 认识协议(核心概念)
协议,网络协议的简称,网络协议是网络通信(即网络数据传输)经过的所有网络设备都必须共同遵从的一组约定、规则。如怎么样建立连接、怎么样互相识别等。只有遵守这个约定,计算机之间才能相互通信交流。
由三要素组成:
- 语法:即数据与控制信息的结构或格式;
类似打电话时,双方要使用同样的语言:普通话
- 语义:即需要发出何种控制信息,完成何种动作以及做出何种响应;
语义主要用来说明通信双方应当怎么做。用于协调与差错处理的控制信息。
类似打电话时,说话的内容。一方道:你瞅啥?另一方就得有对应的响应:瞅你咋的!
- 时序,即事件实现顺序的详细说明。
时序定义了何时进行通信,先讲什么,后讲什么,讲话的速度等。比如是采用同步传输还是
异步传输。
女生和男生的通话,总是由男生主动发起通话,而总是在男生恋恋不舍的时候,由女生要求
结束通话。
协议(protocol)最终体现为在网络上传输的数据包的格式。
为什么需要协议?
好比相亲,彼此协商胸口插支玫瑰花见面,这就是一种提前的约定,也可以称之为协议。
计算机之间的传输媒介是光信号和电信号。通过 “频率” 和 “强弱” 来表示 0 和 1 这样的信息。要想传递各种不同的信息,就需要约定好双方的数据格式。
- 计算机生产厂商有很多;
- 计算机操作系统,也有很多;
- 计算机网络硬件设备,还是有很多;
如何让这些不同厂商之间生产的计算机能够相互顺畅的通信? 就需要有人站出来,约定一个
共同的标准,大家都来遵守,这就是 网络协议;
知名协议的默认端口
系统端口号范围为 0 ~ 65535,其中:0 ~ 1023 为知名端口号,这些端口预留给服务端程序绑定广泛使用的应用层协议,如:
- 22端口:预留给SSH服务器绑定SSH协议
- 21端口:预留给FTP服务器绑定FTP协议
- 23端口:预留给Telnet服务器绑定Telnet协议
- 80端口:预留给HTTP服务器绑定HTTP协议
- 443端口:预留给HTTPS服务器绑定HTTPS协议
需要补充的是:
以上只是说明 0 ~ 1023 范围的知名端口号用于绑定知名协议,但某个服务器也可以使用其他 1024 ~ 65535 范围内的端口来绑定知名协议。
餐厅的VIP包房是给会员使用,但会员也可以不坐包房,坐其他普通座位。
4. 五元组
在TCP/IP协议中,用五元组来标识一个网络通信:
- 源IP:标识源主机
- 源端口号:标识源主机中该次通信发送数据的进程
- 目的IP:标识目的主机
- 目的端口号:标识目的主机中该次通信接收数据的进程
- 协议号:标识发送进程和接收进程双方约定的数据格式
用发送快递来讲就是:
- 源IP:寄件人地址
- 源端口号:寄件人
- 目的IP:收件人地址
- 目的端口号:收件人
- 协议:顺丰快递
5. 协议分层
网络通信,是一个非常复杂的过程,有很多的问题,很多的细节要处理,如果就用一个协议,把所有的问题都解决,就会造成这个协议复杂无比。
于是在这里就有了协议拆分,把协议拆分成多个协议,但是在后续的发展中发现拆分出来的协议解决的问题差不多,因此就再把这些协议分成很多类,就是协议分层。(每一层里都有很多协议,这些协议做的工作都差不多)
当前我们看到的网络结构就是协议分层之后的产物。
网络协议拆分,并分层之后,有啥好处呢?
下层协议给上层提供服务,上层调用下层协议。(封装)
实现上层协议的人,不必考虑下层协议的细节解耦合:可以把同一层协议替换成其他协议,对于其他层次的协议来说,基本是无感知的
类似于打电话我们只需要有语言协议即可,并不需要了解电话协议,也互不影响
当前有两种分层方式:
OSI七层网络模型
(理论上存在,实际上没有这么实现的)TCP/IP五层(或四层)模型
OSI七层网络模型:
TCP/IP五层(或四层)模型:
上面三层统称为应用层
- 应用层:负责应用程序间沟通,如简单电子邮件传输(SMTP)、文件传输协议(FTP)、网络远程访问协议(Telnet)等。我们的网络编程主要就是针对应用层。(数据传输过去之后,具体怎么使用)
- 传输层:负责两台主机之间的数据传输。如传输控制协议 (TCP),能够确保数据可靠的从源主机发送到目标主机。(两个点之间的通信,不考虑路径规划)
- 网络层:负责地址管理和路由选择。例如在IP协议中,通过IP地址来标识一台主机,并通过路由表的方式规划出两台主机之间的数据传输的线路(路由)。路由器(Router)工作在网路层。(两个点之间的路径规划)
- 数据链路层:负责设备之间的数据帧的传送和识别。例如网卡设备的驱动、帧同步(就是说从网线上检测到什么信号算作新帧的开始)、冲突检测(如果检测到冲突就自动重发)、数据差错校验等工作。有以太网、令牌环网,无线LAN等标准。交换机(Switch)工作在数据链路层。(两个相邻节点之间如何传输)
- 物理层:负责光/电信号的传递方式。比如现在以太网通用的网线(双绞 线)、早期以太网采用的的同轴电缆(现在主要用于有线电视)、光纤,现在的wifi无线网使用电磁波等都属于物理层的概念。物理层的能力决定了最大传输速率、传输距离、抗干扰性等。集线器(Hub)工作在物理层。(网络通行基础)
只有应用层是程序可以写代码处理的,其他的都是由操作系统和硬件设备来处理的
网络编程的主要工作就是写应用层代码,来处理应用层的协议数据
物理层我们考虑的比较少。因此很多时候也可以称为 TCP/IP四层模型。
网络设备所在分层:
- 对于一台主机,它的操作系统内核实现了从传输层到物理层的内容,也即是TCP/IP五层模型的下四层;
- 对于一台路由器,它实现了从网络层到物理层,也即是TCP/IP五层模型的下三层;
- 对于一台交换机,它实现了从数据链路层到物理层,也即是TCP/IP五层模型的下两层;
- 对于集线器,它只实现了物理层;
注意我们这里说的是传统意义上的交换机和路由器,也称为二层交换机(工作在TCP/IP五层模型的下两层)、三层路由器(工作在TCP/IP五层模型的下三层)。
面试拓展:
交换机和路由器功能都是用来组建局域网
交换机是工作在数据链路层;路由器是工作在网络层;
实际上路由器和交换机都越来越强大,彼此之间有许多功能的重叠
6. 封装和分用
封装描述了网络是如何传输数据的
例如我们使用 QQ 传输消息,主机 A 发送消息
-
应用层,QQ 应用程序,把用户输入的数据整理成应用层数据报(相当类似于 “字符串拼接” 的方式,构成更完整,信息更多的数据,再传输)
接下来就需要把这个报交给传输层(操作系统内核) -
传输层,会根据当前使用的传输层协议,给应用层数据报进行进一步组装
继续把这个数据报交给网络层 -
网络层,主要使用的是 IP 协议,再进行进一步组装
数据组合好了之后,再交给数据链路层 -
数据链路层,比如使用以太网协议,再进一步组装
构造成了一个以太网数据帧,再把这个数据交给了物理层 -
物理层,拿到数据之后,把这里的这些二进制序列,转换成 光信号/电信号,把光电信号发送出去即可
上述从上到下依次添加报头的过程,就称为封装
当主机 B 收到上述数据的时候,就是封装的 “逆过程” ,称为 “分用”,每一层协议把对应的协议报头给解析出来,并且去掉报头。
-
物理层,把光电信号转换回二进制的数据,得到以太网数据帧,交给数据链路层
-
数据链路层,去掉帧头帧尾,把载荷部分取出来,交给网络层
-
网络层,IP 协议解析出 IP 报头,并去掉,把载荷取出来,交给传输层
-
传输层,UDP 协议再进行解析,解析出 UDP 报头,把载荷取出来,交给应用程序
-
应用层,qq这个程序,qq再解析这里的信息,显示到界面上
上述过程中也就体现出网络通信中各个协议是如何配合工作的
封装分用不仅仅出现在主机上,也出现在传输过程中,包括在交换机和路由器上。
- 经典路由器,是封装分用到网络层
- 经典交换机,是封装分用到数据链路层