一、计算机网络背景
1.网络发展
独立模式
计算机之间相互独立;
网络互联
多台计算机连接在一起, 完成数据共享
局域网LAN
计算机数量更多了, 通过交换机和路由器连接在一起;
广域网WAN
将远隔千里的计算机都连在一起;
"局域网" 和 "广域网" 只是一个相对的概念,为了便于划分,我们可以狭义的将一个家庭,一个学校机房中的计算机看成一个局域网
2.认识 "协议"
"协议" 即可理解为字面意思,简单来说是一种约定.
计算机之间的传输媒介是光信号和电信号. 通过 "频率" 和 "强弱" 来表示 0 和 1 这样的信息. 要想传递各种不同的信息, 就需要约定好双方的数据格式.
我们知道
计算机生产厂商有很多;
计算机操作系统, 也有很多;
计算机网络硬件设备, 还是有很多;
如何让这些不同厂商之间生产的计算机能够相互顺畅的通信? 就需要有人站出来, 约定一个共同的标准,大家都来遵守, 这就是 网络协议;
二、网络协议初识
1.协议分层
打电话例子
在这个例子中, 我们的协议只有两层; 但是实际的网络通信会更加复杂, 需要分更多的层次.
分层最大的好处在于 "封装"
2.OSI七层模型
OSI(Open System Interconnection,开放系统互连)七层网络模型称为开放式系统互联参考模型,是一个逻辑上的定义和规范;
把网络从逻辑上分为了7层. 每一层都有相关、相对应的物理设备,比如路由器,交换机;
OSI 七层模型是一种框架性的设计方法,其最主要的功能使就是帮助不同类型的主机实现数据传输;
它的最大优点是将服务、接口和协议这三个概念明确地区分开来,概念清楚,理论也比较完整. 通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯;
但是, 它既复杂又不实用; 所以我们按照TCP/IP四层模型来讲解.
3.TCP/IP五层(或四层)模型
TCP/IP是一组协议的代名词,它还包括许多协议,组成了TCP/IP协议簇.
TCP/IP通讯协议采用了5层的层级结构,每一层都呼叫它的下一层所提供的网络来完成自己的需求.
物理层: 负责光/电信号的传递方式. 比如现在以太网通用的网线(双绞 线)、早期以太网采用的的同轴电缆(现在主要用于有线电视)、光纤, 现在的wifi无线网使用电磁波等都属于物理层的概念。物理层的能力决定了最大传输速率、传输距离、抗干扰性等. 集线器(Hub)工作在物理层.
数据链路层: 负责设备之间的数据帧的传送和识别. 例如网卡设备的驱动、帧同步(就是说从网线上检测到什么信号算作新帧的开始)、冲突检测(如果检测到冲突就自动重发)、数据差错校验等工作. 有以太网、令牌环网, 无线LAN等标准. 交换机(Switch)工作在数据链路层.
网络层: 负责地址管理和路由选择. 例如在IP协议中, 通过IP地址来标识一台主机, 并通过路由表的方式规划出两台主机之间的数据传输的线路(路由). 路由器(Router)工作在网路层.
传输层: 负责两台主机之间的数据传输. 如传输控制协议 (TCP), 能够确保数据可靠的从源主机发送到目标主机.
应用层: 负责应用程序间沟通,如简单电子邮件传输(SMTP)、文件传输协议(FTP)、网络远程访问协议(Telnet)等. 我们的网络编程主要就是针对应用层
网络与操作系统之间的关系
三、网络传输基本流程
1.网络传输流程图
同一个网段内的两台主机进行文件传输.
局域网通信的原理:(以太网)
我们以一个例子展开:在一间教室里头,老师点名张三站起来回答问题。其它学生都听到了老师的声音,但是没有站起来是因为自己并不是张三。随后张三和老师进行了沟通回答问题。在张三和老师的沟通中,台下的学生都听到了声音。
在教室里头,可以认为老师和张三在单独通信,但在通信的过程其他同学也能听到声音。
局域网中,每一台主机都能收到其它任何主机发出的报文,但是在识别不是发给自己的时候,直接进行了丢弃,这一过程利用了MAC地址的唯一性
MAC地址:正如教室里每一个人都有对应的名字一般,每一台主机都要有唯一的标识:该主机对应的MAC(网卡)地址。
同样的场景,当老师喊张三回答问题时,台下的同学非常吵闹,以至于老师和张三无法正常沟通。我们因此引出碰撞域的概念。
碰撞域:多个主机构成的局域网会形成一个碰撞域。
数据碰撞:任何一台主机,在任何时刻,都可以随时向局域网发消息,所以数据会发生碰撞,数据的碰撞会导致要接受数据的主机无法准确的接受对方的消息。
同样的场景,教室原本十分吵闹,但是当老师喊张三回答问题时,同学们都识别了此次喊话,便停止了自己的吵闹。当回答结束后,再说自己的话。
碰撞检测,碰撞避免:为了防止因碰撞与而无法准确的听到对方的消息,主机要识别是否发生了碰撞(碰撞检测),如果有,再进行碰撞避免。以太网站在系统角度来看,他是被共享的,即临界资源。任何人访问此临界资源若发生了冲突,那就让双方延迟一下再重新发送,这就是碰撞避免。
报文 = 报头 + 有效载荷
因此
几乎任何层的协议,都要提供一种能力,将报头和有效载荷分离的能力。
几乎任何层的协议,都要在报头中提供,决定将自己的有效载荷交付给上一层的哪一个协议的能力。
跨网段的主机的文件传输.
数据从一台计算机到另一台计算机传输过程中要经过一个或多个路由器.
两方的网络层协议也可以不同
注意点
1、网络的数据包在主机内进行流向的时候,一定是自顶向下或自底向上,这是由体系结构决定的:
自顶向下:计算机在发数据要通过硬件转发,用户层数据无法直接抵达硬件,必须贯穿OS,而网络协议栈隶属于OS,所以必须自顶向下交互给硬件。
自底向上:发数据大部分是用户给用户的,底层的硬件没办法直接给用户,所以必须贯穿OS以及对应的协议栈来将数据进行交付,所以要自底向上。
2、同层协议都认为自己在和对方直接通信,每一层都要有自己的协议
用户自认为直接和用户进行通信,应用层自认为直接和对方的应用层进行通信……。它们各层之间完全不关心底层怎么操作的。
就好比如你网购了一款鼠标,你在店家那下了单,你在通信时只和店家沟通,沟通完后底下的细节你不关心,只需要等货即可。
而卖家和你沟通完后,调用底层接口(快递员),填好快递单,由快递员邮寄到你手上,你同样是不关心货物如何到你手上的,你只关心什么时候到
2.数据包封装和分用
不同的协议层对数据包有不同的称谓,在传输层叫做段(segment),在网络层叫做数据报 (datagram),在链路层叫做帧(frame).
应用层数据通过协议栈发到网络上时,每层协议都要加上一个数据首部(header),称为封装
(Encapsulation).
首部信息中包含了一些类似于首部有多长, 载荷(payload)有多长, 上层协议是什么等信息.
数据封装成帧后发到传输介质上,到达目的主机后每层协议再剥掉相应的首部, 根据首部中的 "上层协议字段" 将数据交给对应的上层协议处理
我们把自顶向下添加包头的过程称之为封装,把自底向上对协议解析,再向上交付的过程就称之为解包。
下图为数据封装的过程
下图为数据分用的过程
四、网络中的地址管理
1.认识IP地址
IP协议有两个版本, IPv4和IPv6. 我们整个的课程, 凡是提到IP协议, 没有特殊说明的, 默认都是指IPv4
IP地址是在IP协议中, 用来标识网络中不同主机的地址;
对于IPv4来说, IP地址是一个4字节, 32位的整数;
我们通常也使用 "点分十进制" 的字符串表示IP地址, 例如 192.168.0.1 ; 用点分割的每一个数字表示一个字节, 范围是 0 - 255;
2.认识MAC地址
MAC地址用来识别数据链路层中相连的节点;
长度为48位, 及6个字节. 一般用16进制数字加上冒号的形式来表示(例如: 08:00:27:03:fb:19)
在网卡出厂时就确定了, 不能修改. mac地址通常是唯一的(虚拟机中的mac地址不是真实的mac地址, 可能会冲突; 也有些网卡支持用户配置mac地址).
一般我们在进行路线选择的时候,我们一般有两套地址:
从哪里来,到哪里去(IP地址:源IP,目的IP)
上一站从哪里来,下一站要去哪里(MAC地址:源MAC地址,目标MAC地址,由目的IP决定)
综上:
MAC地址:用来在局域网中,标定主机的唯一性
IP地址,用来在广域网(公网),标定主机的唯一性