网络互连
随着时代的发展,越来越需要计算机之间互相通信,共享软件和数据,即以多个计算机协同工作来完成业务,就有了网络互连。
网络互连:将多台计算机连接在一起,完成数据共享。
数据共享本质是网络数据传输,即计算机之间通过网络来传输数据,也称为网络通信。
根据网络互连的规模不同,可以划分为局域网和广域网。
局域网LAN
局域网,即 Local Area Network,简称LAN
。
Local 即标识了局域网是本地,局部组建的一种私有网络。
局域网内的主机之间能方便的进行网络通信,又称为内网;局域网和局域网之间在没有连接的情况下,是无法通信的。
广域网WAN
广域网,即 Wide Area Network,简称WAN
。
通过路由器,将多个局域网连接起来,在物理上组成很大范围的网络,就形成了广域网。广域网内部的局域网都属于其子网。
如果属于全球化的公共型广域网,则称为互联网(又称公网,外网),属于广域网的一个子集。
有时在不严格的环境下说的广域网,其实是指互联网
。
所谓 “局域网” 和 “广域网” 只是一个相对的概念。比如,我们有 “天朝特色” 的广域网,也可以看做一个比较大的局域网。
网络通信基础
网络互连的目的是进行网络通信,也即是网络数据传输,更具体一点,是网络主机中的不同进程间,基于网络传输数据。
那么,在组建的网络中,如何判断到底是从哪台主机,将数据传输到那台主机呢?这就需要使用IP地址来标识。
IP地址
概念
IP地址主要用于标识网络主机、其他网络设备(如路由器)的网络地址
。简单说,IP地址用于定位主机的网络地址。
就像我们发送快递一样,需要知道对方的收货地址,快递员才能将包裹送到目的地。
格式
IP地址是一个32位的二进制数,通常被分割为4个“8位二进制数”(也就是4个字节),如: 01100100.00000100.00000101.00000110。
通常用“点分十进制
”的方式来表示,即 a.b.c.d 的形式(a,b,c,d都是0~255之间的十进制整数)。如:100.4.5.6。
特殊IP
127.*的IP地址用于本机环回(loop back)测试
,通常是127.0.0.1
。本机环回主要用于本机到本机的网络通信(系统内部为了性能,不会走网络的方式传输),对于开发网络通信的程序(即网络编程)而言,常见的开发方式都是本机到本机的网络通信。
IP地址解决了网络通信时,定位网络主机的问题,但是还存在一个问题,传输到目的主机后,由哪个进程来接收这个数据呢?这就需要端口号来标识。
端口号
概念
在网络通信中,IP地址用于标识主机网络地址,端口号可以标识主机中发送数据、接收数据的进程。简单说:端口号用于定位主机中的进程。
类似发送快递时,不光需要指定收货地址(IP地址),还需要指定收货人(端口号)。
格式
端口号是0~65535范围的数字,在网络通信中,进程可以通过绑定一个端口号,来发送及接收网络数据。
注意事项
两个不同的进程,不能绑定同一个端口号,但一个进程可以绑定多个端口号。
了解:
一个进程启动后,系统会随机分配一个端口(启动端口),程序代码中,进行网络编程时,需要绑定端口号(收发数据的端口)来发送、接收数据。
进程绑定一个端口号后,fork一个子进程,可以实现多个进程绑定一个端口号,但不同的进程不能绑定同一个端口号。
问题:
有了IP地址和端口号,可以定位到网络中唯一的一个进程,但还存在一个问题,网络通信是基于二进制 0/1数据来传输,如何告诉对方发送的数据是什么样的呢?
网络通信传输的数据类型可能有多种:图片,视频,文本等。同一个类型的数据,格式可能也不同,如发送一个文本字符串“你好!”:如何标识发送的数据是文本类型,及文本的编码格式呢?
基于网络数据传输,需要使用协议来规定双方的数据格式
认识协议
概念
协议,网络协议的简称,网络协议是网络通信(即网络数据传输)经过的所有网络设备都必须共同遵从的一组约定、规则。如怎么样建立连接、怎么样互相识别等。只有遵守这个约定,计算机之间才能相互
通信交流。通常由三要素组成:
语法
:即数据与控制信息的结构或格式;
类似打电话时,双方要使用同样的语言:普通话语义
:即需要发出何种控制信息,完成何种动作以及做出何种响应;
语义主要用来说明通信双方应当怎么做。用于协调与差错处理的控制信息。
类似打电话时,说话的内容。一方道:你好?另一方就得有对应的响应:你好!交换规则
:规定事件实现顺序的详细说明,即确定通信状态的变化和过程,如通信双方的应答关系。
时序定义了何时进行通信,先讲什么,后讲什么,讲话的速度等。比如是采用同步传输还是异步传输。
协议(protocol)最终体现为在网络上传输的数据包的格式。
作用
为什么需要协议?
就好比见网友,彼此协商胸口插支玫瑰花见面,这就是一种提前的约定,也可以称之为协议。
计算机之间的传输媒介是光信号和电信号。通过 “频率” 和 “强弱” 来表示 0 和 1 这样的信息。要想传递各种不同的信息,就需要约定好双方的数据格式。
计算机生产厂商有很多;计算机操作系统,也有很多;计算机网络硬件设备,还是有很多;如何让这些不同厂商之间生产的计算机能够相互顺畅的通信? 就需要有人站出来,约定一个共同的标准,大家都来遵守,这就是 网络协议;
知名协议的默认端口
系统端口号范围为 0 ~ 65535,其中:0 ~ 1023 为知名端口号,这些端口预留给服务端程序绑定广泛使用的应用层协议,如:
22端口:预留给SSH服务器绑定SSH协议
21端口:预留给FTP服务器绑定FTP协议
23端口:预留给Telnet服务器绑定Telnet协议
80端口:预留给HTTP服务器绑定HTTP协议
443端口:预留给HTTPS服务器绑定HTTPS协议
以上只是说明 0 ~ 1023 范围的知名端口号用于绑定知名协议,但某个服务器也可以使用其他 1024 ~65535 范围内的端口来绑定知名协议。
五元组
在TCP/IP协议中,用五元组来标识一个网络通信:
源IP
:标识源主机源端口号
:标识源主机中该次通信发送数据的进程目的IP
:标识目的主机目的端口号
:标识目的主机中该次通信接收数据的进程协议号
:标识发送进程和接收进程双方约定的数据格式
协议分层
对于网络协议来说,往往分成几个层次进行定义
分层的作用
为什么需要网络协议的分层?
分层最大的好处,类似于面向接口编程:定义好两层间的接口规范,让双方遵循这个规范来对接。在代码中,类似于定义好一个接口,一方为接口的实现类(提供方,提供服务),一方为接口的使用类(使用方,使用服务):
对于使用方来说,并不关心提供方是如何实现的,只需要使用接口即可
对于提供方来说,利用封装的特性,隐藏了实现的细节,只需要开放接口即可。
OSI七层模型
OSI:即Open System Interconnection,开放系统互连
OSI 七层网络模型是一个逻辑上的定义和规范:把网络从逻辑上分为了7层。
OSI 七层模型是一种框架性的设计方法,其最主要的功能使就是帮助不同类型的主机实现数据传输;
它的最大优点是将服务、接口和协议这三个概念明确地区分开来,概念清楚,理论也比较完整。通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯。
OSI 七层模型既复杂又不实用:所以 OSI 七层模型没有落地、实现。
实际组建网络时,只是以 OSI 七层模型设计中的部分分层,也即是以下 TCP/IP 五层模型来实现。
TCP/IP五层模型
TCP/IP是一组协议的代名词,它还包括许多协议,组成了TCP/IP协议簇。
TCP/IP通讯协议采用了5层的层级结构,每一层都呼叫它的下一层所提供的网络来完成自己的需求。
应用层
:负责应用程序间沟通,如简单电子邮件传输(SMTP)、文件传输协议(FTP)、网络远程访问协议(Telnet)等。我们的网络编程主要就是针对应用层。
传输层
:负责两台主机之间的数据传输。如传输控制协议 (TCP),能够确保数据可靠的从源主机发送到目标主机。
网络层
:负责地址管理和路由选择。例如在IP协议中,通过IP地址来标识一台主机,并通过路由表的方式规划出两台主机之间的数据传输的线路(路由)。路由器(Router)工作在网路层。
数据链路层
:负责设备之间的数据帧的传送和识别。例如网卡设备的驱动、帧同步(就是说从网线上检测到什么信号算作新帧的开始)、冲突检测(如果检测到冲突就自动重发)、数据差错校验等工作。有以太网、令牌环网,无线LAN等标准。交换机(Switch)工作在数据链路层。
物理层
:负责光/电信号的传递方式。比如现在以太网通用的网线(双绞 线)、早期以太网采用的同轴电缆(现在主要用于有线电视)、光纤,现在的wifi无线网使用电磁波等都属于物理层的概念。物理层的能力决定了最大传输速率、传输距离、抗干扰性等。集线器(Hub)工作在物理层。
物理层我们考虑的比较少。因此很多时候也可以称为 TCP/IP四层模型。
网络设备所在分层:
- 对于一台主机,它的操作系统内核实现了从传输层到物理层的内容,也即是TCP/IP五层模型的下四层;
- 对于一台路由器,它实现了从网络层到物理层,也即是TCP/IP五层模型的下三层;
- 对于一台交换机,它实现了从数据链路层到物理层,也即是TCP/IP五层模型的下两层;
- 对于集线器,它只实现了物理层;
注意我们这里说的是传统意义上的交换机和路由器,也称为二层交换机(工作在TCP/IP五层模型的下两层)、三层路由器(工作在TCP/IP五层模型的下三层)。
随着现在网络设备技术的不断发展,也出现了很多3层或4层交换机,4层路由器。我们以下说的网络设备都是传统意义上的交换机和路由器。
网络分层对应
网络数据传输时,经过不同的网络节点(主机、路由器)时,网络分层需要对应。
以下为同一个网段内的两台主机进行文件传输:
两台计算机通过TCP/IP协议通讯的过程如下所示:
封装和分用
- 不同的协议层对数据包有不同的称谓,在传输层叫做
段
(segment),在网络层叫做数据报
(datagram),在链路层叫做帧
(frame)。 - 应用层数据通过协议栈发到网络上时,每层协议都要加上一个
数据首部
(header),称为封装(Encapsulation)。 - 首部信息中包含了一些类似于首部有多长,载荷(payload)有多长,上层协议是什么等信息。
- 数据封装成帧后发到传输介质上,到达目的主机后每层协议再剥掉相应的首部,根据首部中的 “上层协议字段” 将数据交给对应的上层协议处理。
下图为数据封装的过程:
下图为数据分用的过程:
TCP/IP概述
TCP
:传输控制协议(Transmission Control Protocol)
IP
:网际协议(Internet Protocol)
TCP/IP是目前世界上流行最广的一种著名的网络体系结构。它并非国际标准,但是它已成为计算机网络的事实上的标准,有人也称为它是工业标准。
TCP/IP具有以下特点:
(1)开放的协议标准,可以免费使用,并且独立特定的计算机硬件和操作系统。
(2)独立于特定的网络硬件,可以运行在局域网、广域网,更适合于互联网中。
(3)统一的网络地址分配方案,使得整个TCP/IP设备在网络中具有唯一的地址。
(4)标准化的高层协议,可以提供多种可靠的用户服务。
网际层协议
(1)网际协议(IP协议)
网际协议(Internet Protocol,IP)的任务是对数据包进行相应的寻址和路由,并从一个网络转发到另一个网络。
IP在每个发送的数据包前加入一条控制信息,其中包含了源主机的IP地址目的主机的IP地址和其他一些信息。
IP协议的另一项工作是分割和重编在传输层被分割的数据包。
IP是一个无连接的协议。因此,要实现数据包的可靠传输,就必须依靠高层的协议或应用程序,如传输层的TCP协议。
(2)网际控制报文协议(ICMP协议)
网际控制报文协议(Internet Control Message Protocol,ICMP)为IP协议提供差错报告。由于IP是无连接的,且不进行差错检验,当网络上发生错误时它不能检测错误,向发送IP数据包的主机报错误就是ICMP的责任。
ICMP能够报告的一些普通错误类型有:目标无法到达、阻塞、回波请求和回波应答等。
(3)网际主机组管理协议(IGMP协议)
IP协议只是负责网络中点到点的数据包传输,而点到多点的数据包传输则要依靠网际主机组管理协议(Internet Group Management Protocol,IGMP)来完成。
它主要负责报告主机组之间的关系,以便相关的设备(路由器)可支持多播发送。
(4)地址解析协议(ARP协议)
计算机网络中各主机之间要进行通信时,必须要知道彼此的物理地址(OSI模型中数据链路层的地址)。
因此,在TCP/IP的网际层有:
地址解析协议(Address Resolution Protocol,ARP)和反向地址解析协议(Reverse Address Resolution Protocol,RARP),
它们的作用是将源主机和目的主机的IP地址与它们的物理地址相匹配。
传输层协议
(1)传输控制协议(TCP协议)
传输控制协议(Transmission Control Protocol,TCP)是传输层的一种面向连接的通信协议,它可提供可靠的数据传输。大量数据通常都要求有可靠的传输。
TCP协议将源主机应用层的数据分成多个分段,然后将每个分段传送到网际层,网际层将数据封装为IP数据包,并发送到目的主机。目的主机的网际层将IP数据包中的分段传送给传输层,再由传输层对这些分段进行重组,还原成原始数据,并传送给应用层。另外,TCP协议还要完成流量控制和差错检验的任务,以保证可靠的数据传输。
(2)用户数据报协议(UDP协议)
用户数据报协议(User Datagram Protocol,UDP)是一种面向无连接的协议,因此,它不能提供可靠的数据传输,而且UDP不进行差错检验,必须由应用层的应用程序来实现可靠性机制和差错控制,以保证端到端数据传输的正确性。虽然UDP与TCP相比显得非常不可靠,但在一些特定的环境下还是非常有优势的。
应用层协议
应用层的协议主要有以下几种:
远程终端协议Telnet:本地上机作为仿真终端登录到远程主机上运行应用程序。
文件传输协议FTP:实现主机之间的文件传送。
简单邮件传输协议SMTP:实现主机之间电子邮件的传送。
域名服务DNS:用于实现主机名与IP地址之间的映射。
动态主机配置协议DHCP:实现对主机的地址分配和配置工作。
路由信息协议RIP:用于网络设备之间交换路由信息。
超文本传输协议HTTP:用于Internet中的客户机与WWW服务器之间的数据传输。
网络文件系统NFS:实现主机之间的文件系统的共享。
引导协议BOOTP:用于无盘主机或工作站的启动。
简单网络管理协议SNMP:实现网络的管理。