Linux网络编程（一）计算机网络的一些基础概念

东方未明0108

于 2024-09-27 08:37:42 发布

阅读量688

点赞数 11

分类专栏： Linux网络编程文章标签：网络协议 linux

本文链接：https://blog.csdn.net/m0_73682725/article/details/142560213

版权

Linux网络编程专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、网络协议的基本概念

根据冯诺依曼体系结构，单台机器的数据，通过数据线进行传输；而长距离，多台机器之间数据的传输，就需要使用网络。

计算机有许多生产厂家、也有许多不同的操作系统和硬件设备，如何让这些不同厂商之间生产的操作系统不尽相同的计算机能够顺畅的通信？

就需要约定一个共同的标准，让所有计算机都要遵守，这就是网络协议。

在网络通信中，会存在这么几个问题

1、如何保证能把数据交给下一跳主机？（IP协议）

2、在转发中如何进行路径的选择，如何进行目标主机的定位？（IP协议+MAC协议）

3、如果传输的数据（又称报文）中间出现错误/丢失怎么办？如何可靠的进行传输？（TCP/IP协议）

4、送达的数据如何使用？（多个协议协同使用）

这每一个问题都有对应的协议来解决，因此，网络由许多个协议构成。

二、网络协议的分层

因为网络通信的复杂，为了各个协议的解耦合，便于维护，计算机网络采用层状结构进行处理。

分层最大的好处，就是把各个协议进行了分层封装，一般只允许同层间进行通信。

计算机网络中常用两种层状结构：OSI七层模型、TCP/IP五层（或四层）模型

1、OSI七层模型

OSI（Open System Interconnection，开放系统互连）七层网络模型全称为开放式系统互联参考模型，是一个逻辑上的定义和规范；它把网络从逻辑上分为了7层，每一层都有相关、相对应的物理设备，比如路由器，交换机。

OSI 七层模型是一种框架性的设计方法，其最主要的功能是帮助不同类型的主机实现数据传输；最大优点是将服务、接口和协议这三个概念明确地区分开来，概念清楚，理论也比较完整.。

通过七个层次化的结构模型可以使不同系统，不同网络之间实现可靠的通讯。

但是，它既复杂又不实用，所以笔者通常按照TCP/IP五层（或四层）模型学习。

2、TCP/IP五层（或四层）模型

TCP/IP五层（或四层）模型也是在工程实践中所用的网络分层模型。TCP/IP是一组协议的代名词，它包括着许多协议，共同组成TCP/IP协议簇。

TCP/IP协议栈（即网络协议栈）与操作系统间的关系非常密切，不同操作系统内核不同，没有统一的标准，但是网络协议栈有统一的标准。

因此，不同OS的网络协议栈必须相同，不同OS提供的有关网络的系统调用接口也必然是大同小异的。

TCP/IP通讯协议采用了5层的层级结构，每一层都呼叫它的下一层所提供的网络来完成自己的需求

从上往下依次解释

应用层：负责应用程序间的沟通，如简单电子邮件传输（SMTP）、文件传输协议（FTP）、网络远程访问协议（Telnet）、超文本传输协议（HTTP）等.，我们的网络编程主要就是针对应用层。

传输层：负责两台主机之间的数据传输，如传输控制协议 (TCP)等。能够确保数据可靠的从源主机发送到目标主机。

网络层： 负责地址管理和路由选择。例如在IP协议中，通过IP地址来标识一台主机，并通过路由表的方式，规划出两台主机之间的数据传输的线路(路由)。路由器(Router)工作在网络层。

数据链路层： 负责设备之间的数据帧的传送和识别。例如网卡设备的驱动、帧同步(就是说从网线上检测到什么信号算作新帧的开始)、冲突检测(如果检测到冲突就自动重发)、数据差错校验等工作。有以太网、令牌环网、无线LAN等标准。交换机(Switch)工作在数据链路层。

物理层：负责光/电信号的传递方式. 比如现在以太网通用的网线(双绞线)、早期以太网采用的的同轴电缆 (现在主要用于有线电视)、光纤；现在的wifi无线网使用电磁波等都属于物理层的概念。物理层的能力决定了最大传输速率、传输距离、抗干扰性等。集线器(Hub)工作在物理层。

因为物理层对于后端开发而言，考虑的比较少，所以这个模型也可以称作TCP/IP四层模型（忽略物理层）

一般而言，一台主机的OS内核会实现从传输层到物理层的内容；一台路由器会实现从网络层到物理层的内容；一台交换机会实现从数据链路层到物理层的内容；一台集线器只实现物理层

三、计算机网络中常用到的两个地址

IP地址

IP地址是网络层IP协议中，用来标识网络中不同主机的地址。每个主机在网络中的IP地址都是独一无二的。

IP地址有两个版本，IPv4和IPv6。对于IPv4来说，IP地址是一个4字节32位的整数，而对于IPv6来说IP地址是一个16字节128位的整数，所以IPv6可以承载更多IP地址。

不过二者并不兼容，且现在主流IP地址版本仍然是IPv4，因此后面的IP地址一律按照IPv4来学习。

对于IPv4的IPI地址，我们通常使用“点分十进制”的字符串来表示IP地址（eg：192.168.0.1），点分割的每一个数字表示一个字节（8位），范围是0-255。

MAC地址

MAC地址是数据链路层中，用来识别相连的不同主机/路由器节点的地址。长度为6字节48位，一般用十六进制搭配冒号的形式来表示（eg：08:00:27:03:fb:19）

MAC主机通常是唯一的，在每个网卡出厂时就已经确定；但有些网卡支持用户配置MAC地址。

（PS：值得注意的是，虚拟机中的MAC地址不是真实MAC地址，所以可能冲突）

IP地址 VS MAC地址

IP地址：网络层IP协议使用，报文的目标IP，用于路径选择的终极目标。从哪里来到哪里去的地址，永远不变。

MAC地址：数据链路层使用，用于局域网通信中标识主机唯一性，从这一个节点（通常称作这一跳）跳转至下一跳，上一站从哪里来，下一站到哪里去。

四、网络传输的基本流程

1、同一个网段内传输

同一个网段内的两台主机进行数据传输时，通常需要从上往下贯穿四层模型。

协议的重新理解

协议在内核中通常是以一个通信双方都可以识别的结构化字段来表征的，这个结构化字段定义的对象通常被称作协议的报头。真实发送的数据往往会比期望发送的数据多上一部分，这部分就是报头。

（PS：因此任何协议都要解决如何把自己的报头和有效载荷进行分离，）

发送方在自上而下贯穿协议栈的时候（称作向下交付/入栈），每经过一层，数据都要添加对应层的报头，发送报文的同时，也在发送报头。

接收方接收数据时自下而上贯穿协议栈（称作向上交付/出栈），每经过一层，对应层的报头都要分离。

（因此，任何一个协议，都必须解决的一个问题是如何把报文中的自己层的报头和有效载荷进行分离，并交付给上层协议。）

什么是以太网

在同一个网段（局域网）中，两台主机可以直接通信。发送方发消息，局域网中的所有主机都可以收到，通过MAC地址来判断消息可以被哪台主机接收。

因为发送方发消息，局域网中的所有主机都可以收到，所以如果局域网中的多个主机都在发消息，容易发生数据碰撞（多个主机发送的数据发生冲突，导致数据损坏）。所以一个局域网又被称作一个碰撞域。如果检测到发生数据碰撞，这些数据将全部作废，消息收发双方都会执行碰撞避免算法（收发双方暂停发送新的消息一段时间，把空间留给其他主机）

因此想要正确的发送数据，任何时刻都应该只允许一台主机在局域网发消息。我们把基于碰撞域、碰撞检测、碰撞避免的，基于概率的局域网通信称作以太网。

从系统层面看，局域网就是一个临界资源，主机执行发送就是访问临界区代码，数据发生碰撞就是数据不一致，执行碰撞避免算法因此某主机单独发送就是独占系统资源；碰撞检测、避免，数据重发就是完成互斥访问。