文章目录
Linux网络基础(一)
前言
今天我们开始接触计算机网络相关的知识,总的来说计算机网络的学习相比计算机操作系统的学习两者不相上下,如果你已经对操作系统有一定的知识体系,那么学习计算机网络将会变得很轻松。这是网络基础的第一章,里面涉及的新名词不会详细的介绍,会在后续更新的博客中详细介绍。
一、网络的发展
独立模式:计算机之间相互独立
在早期的时候,计算机之间是相互独立的,如果多个计算机要协同完成某种业务,那么就只能等一台计算机处理完后再将数据传递给下一台计算机,然后下一台计算机再进行相应的业务处理,效率非常低下。
网络互联:多台计算机连接在一起,完成数据共享
于是就有人设法将这些计算机连接在一起,当某个业务需要多台计算机协同完成时,就可以将共享的数据放到服务器中进行集中管理,此时各个计算机都能获取到这些共享的数据,所以各个业务在处理时就能随时进行切换了。
1.局域网
局域网(Local Area Network,LAN)是指在某一区域内由多台计算机互联成的计算机组。多个局域网之间可以由路由器连接在一从而实现跨局域网通信,形成一个更大的局域网。在局域网中有一种设备叫做交换机,交换机主要完成局域网内数据的转发工作,也就是在局域网内将数据从一台主机转发给另一台主机。各个局域网之间通过路由器连接起来,路由器主要完成数据的路由转发工作。
2.广域网
广域网WAN:将远隔千里的计算机都连在一起;广域网和局域网是相对的概念,一个比较大的局域网就可以称之为广域网。
当然在很多教材中还出现了城域网,无外乎还是由局域网组建而成,只不过三者的范围不同,我们这里就不去过多研究。
二、网络协议的概念
网络协议为计算机网络中进行数据交换而建立的规则、标准或约定的集合。计算机之间的传输媒介是光信号和电信号,通过“频率”和“强弱”来表示0和1这样的信息,要想传递各种不同的信息,就需要约定好双方的数据格式。
1.初始网络协议
所谓的网络究竟在哪里?
网络也是软件,软件都是层状结构,网络协议栈也是分层的。它是贯穿于计算机体系结构的一个软件,尤其是TCP/IP协议栈,是属于操作系统的一部分。
2.理解协议分层
关于协议的分层,我们以A和C的对话为例简单说明一下。在此我们只考虑语言层和通信设备层两种情况。
表面上看A和C在用汉语直接对话,但实际上A与C都是在通过电话机的听筒听取声音,都在对着麦克风说话。其实在这张图中,他们使用的语言协议作为麦克风的音频输入,在通信设备层转换为电波信号传送出去了。传送到对方的电话机后,又被通信设备层转换为音频输出,传递给对方。
如果我们只在通信设备层做出改变,将电话机改变为无线电,情况会如何?
通信设备层改为无线电,那么双方就要学会使用无线电的方法。由于语言层任然所使用的是汉语,因此使用者可以完全和以往打电话一样正常通话。
如果我们只在语言层做出改变,将汉语改变为英语,情况会如何?
虽然语言层改变为英语,但是电话机本身并不会受限于使用者的语言,因此这种情况与使用汉语并没有区别,依然可以通话。
总的来说,双方都是达成了“协议”,因此层状结构是一种很优秀的设计,它一定程度上实现了“解耦”,实现了解耦后,任何一层都可以进行替换,即便在某层中出现BUG,也可以将问题聚焦在指定的一层中,不会影响到其他层。
3.OSI七层模型
前面只是将协议简单分为了两层进行了举例说明。然而,实际的分组通信协议会相当复杂。OSI参考模型将这样一个复杂的协议整理并分为了易于理解的7个分层。
- OSI(Open System Interconnection,开放系统互连)七层网络模型称为开放式系统互联参考模型,是一个逻辑上的定义和规范;
- 把网络从逻辑上分为了7层,每一层都有相关,相对应的物理设备,比如路由器,交换机;
- OSI七层模型是一种框架性的设计方法,其最主要的功能就是帮助不同类型的主机实现数据传输;
- 它的最大优点是将服务、接口和协议这三个概念明确地区分开来,概念清楚,理论也比较完整,通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯;
- 但是,它既负责又不实用;所以我们按照TCP/IP四层模型来讲解
4.TCP/IP四层模型
TCP/IP是一组协议的代名词,它还包括许多协议,组成了TCP/IP协议簇
TCP/IP通讯协议采用了5层的层级结构,每一层都呼吁它的下一层所提供的网络来完成自己的需求。
- 物理层:
负责光/电信号的传递方式,比如现在以太网通用的网线(双绞线)、早期以太网采用的是同轴电缆(现在主要用于有线电视)、光纤,现在的wifi无线网使用电磁波等都属于物理层的概念。物理层的能力决定了最大传输速率、传输距离、抗干扰性等,集线器(Hub)工作在物理层。 - 数据链路层:
负责设备之间的数据帧的传送和识别,例如网卡设备的驱动、帧同步(就是说从网线上检测到什么信号算作新帧的开始)、冲突检测(如果检测到冲突就自动重发)、数据差错校验等工作,有以太网、令牌环网、无线LAN等标准、交换机(Switch)工作在数据链路层 - 网络层:
负责地址管理和路由选择,例如在IP协议中,通过IP地址来标识一台主机,并通过路由表的方式规划出两台主机之间的数据传输的线路(路由),路由器(Router)工作在网络层。 - 传输层:
负责两台主机之间的数据传输,如传输控制协议(TCP),能够确保数据可靠的从源主机发送到目标主机 - 应用层:
负责应用程序间沟通,如简单电子邮件传输(SMTP)、文件传输协议(FTP)、网络远程访问协议(Telnet)等,我们的网络编程主要就是针对应用层。
物理层我们考虑的比较少,因此很多时候也可以称为TCP/IP四层模型
一般而言
- 对于一台主机,它的操作系统内核实现了从传输层到物理层的内容;
- 对于一台路由器,它实现了网络层到物理层
- 对于一台交换机,它实现了从数据链路层到物理层
- 对于集线器,它只实现了物理层
集线器的英文“Hub”。“Hub”是“中心”的意思,集线器的主要功能是对接收到的信号进行再生整形放大,以扩大网络的传输距离,同时把所有节点集中在以它为中心的节点上。它工作于OSI参考模型的第一层,即“物理层”。
三、网络传输流程
我们以TCP/IP协议的通讯过程为例认识一下网络传输的基本过程
1.局域网通信
先看局域网中两台主机通信的示意图,左右两边各是一台主机
当用户要将文件传输给另一台主机前,该文件数据需要先通过网络协议栈进行封装:
- 文件数据先交给应用层,应用层添加上对应应用层协议的报头信息后,将数据再交给传输层
- 传输层受到数据后,再添加上对应传输层协议的报头信息,并将数据继续向下进行交付
- 网络层受到数据后,再添加上对应网络层协议的报头信息,接着将数据再交给链路层。
- 链路层受到数据后,最后再添加上对应链路层协议的报头信息,至此数据封装完毕
数据封装完毕后就可以通过以太网将其发送给对端主机了,而当对端主机收到数据后,对应也需要通过网络协议栈对该数据进行解包与分用:
- 链路层收到数据后,先将数据中对应的链路层协议的报头信息提取出来,然后将剩下的数据交给网络层。
- 网络层收到该数据后,再将数据中对应网络层协议的报头信息提取出来,然后将剩下的数据继续向上进行交付。
- 传输层收到该数据后,再将数据中对应传输层协议的报头信息提取出来,然后将剩下的数据再交付给应用层
- 应用层收到数据后,最后将数据中对应应用层协议的报头信息提取出来,至此便完成了数据的解包与分用。
总的来说,任何一台主机在发送数据之前,该数据都要先自顶向下贯穿协议栈来完成数据的封装,在这个过程中,每一层协议都会添加上对应的报头信息;而任何一个主机收到数据后,都要先自底向上贯穿协议栈来完成数据的解包和分用,在这个过程中,每一层协议都会将对应的报头信息提取出来。
1.报头的理解
在学习网络的初期,我们不设计协议相关的知识点,我们从C语言的角度理解一下。报头就类似于快递单号,它具有一定的格式和相对应的数据;报头中的数据用来指导当前层进行某种协议决策,传输层的报头指导如何传输,网络层的报头指导路径选择,链路层的报头指导如何转发。
在计算机系统中,报文由两部分组成报头和有效载荷,只有当前层的报头被认为是报头,之后的都是有效载荷。
报头也是数据,是一种结构化的数据,在语言角度就是位段:
//(假设)报头结构
struct my_hdr {
unsigned int src:16;
unsigned int dst:16;
unsigned int type:8;
unsigned int len:24;
}
struct my_hdr my = { 0x1, 0x2, 0x3, 0x9 };
封装就是将报头位段变量使用memcpy放到有效载荷的前面,解包就使用位段类型的指针struct my_hdr* ptr向后++操作,取出相应的报头信息。
几乎每一层协议的报头字段中,都要包含两种字段:
- 明确报头和有效载荷的边界,将报头交给对应协议栈的过程叫做解包。
- 报文的有效载荷得交给上层的哪一种协议,选择交给上层哪一种协议的过程叫做分用。
2.数据包的封装与分用
- 不同的协议层对数据包有不同的称谓,在传输层叫做段(segment),在网络层叫做数据报(datagram),在链路层叫做帧(frame)。
- 应用层数据通过协议栈发到网络上时,每层协议都要加上一个数据首部(header),称为封装(Encapsulation)。
- 首部信息中包含了一些类似于首部有多长,载荷(payload)有多长,上层协议是什么等信息。
- 数据封装成帧后发到传输介质上,到达目的主机后每层协议在剥掉相应的首部,根据首部中的“上层协议字段”将数据交给对应的上层协议处理
封装的过程:
分用的过程:
2.广域网通信
数据已经封装好了,准备进行发送,如果对方和自己不在同一个局域网就要进行路由器的转发,如下图:
有两个局域网,中间的路由器可以作为左边局域网的主机也可以作为右边局域网内的主机。路由器接受到左侧发送过来的数据后,进行解包,发现MAC地址不在本局域网内,然后去除之前的以太网首部,通过查询路由表确定新的MAC地址,再次添加以太网首部,然后发送到另一个局域网内。
对于路由器的相关概念,我们在后面会进行介绍,这里只需要了解两个主机跨网络通信的大致流程即可;
四、网络中的地址管理
1.认识IP地址
IP协议有两个版本,IPV4和IPV6,我们提到的IP协议默认都是IPV4
- IP地址是在IP协议中,用来标识网络中不同主机的地址;
- 对于IPV4来说,IP地址是一个4字节,32位的整数
- 我们通常也使用“点分十进制”的字符串表示IP地址,例如 192.168.0.1;用点分割的每一个数字表示一个字节,范围是0~255;
2.认识MAC地址
- MAC地址用来识别数据链路层中相连的节点;
- 长度为48位,及6个字节,一般用16进制数字加上冒号的形式来表示(例如:08:00:27:03:fb:19)
- 在网卡出厂时就确定了,不能修改,mac地址通常是唯一的(虚拟机中的mac地址不是真实的mac地址,可能会冲突,也有些网卡支持用户配置mac地址)
我们可以输入ifconfig指令查看MAC地址;ifconfig命令可以查看当前主机所对应的网卡信息
其中ether对应就有“以太”的意思,而ether后面的这个地址就是当前云服务器所对应的MAC地址。但实际云服务器上的MAC地址可能不谁真正的MAC地址,该MAC地址可能是模拟出来的。