网络编程
什么是网络编程:
基于网络编写的应用程序简称为网络编程
为什么要网络编程
让计算机之间能够利用网路来相互传输数据.
一. c/s架构
学习网络编程的目的,就是利用网络访问另一台计算机的数据,那么至少需要两台电脑,一台为服务器(server),提供数据, 一台为客户端(client),访问数据
二. 网络通讯的基本要素
1:物理连接介质
数据传播是需要物理介质才能进行的 这是物理常识
2:通讯协议
就是一种协议规范 因为计算机之间传递的信息都是二进制 需要制定标准 表明传递的01 分别表示什么含义
三. 网络通讯协议
osi七层模型
1.什么是osi
简称:开放式系统互联通信参考模型,缩写为OSI, ( Open System Interconnection Reference Model)
osi把整个通讯过程划分为七层,简称为osi七层模型
最右边是是完整的七层模型,是最完整的通讯模型,虽然很详尽,但是整个通讯流程的复杂度较高,后期为了降低学习难度,将其进行了简化,于是又了中间的五层,和左边的四层
2.为什么要osi
英语是世界通用语言 那么osi就相当于计算机界的通用语言 只要按照osi制定的标准来通讯 就能与世界上的任何一台计算机通讯
OSI各层工作原理
(应表会传网数物) 简记
一.物理层
物理层的功能:基于电子元器发送电流信号,根据电流高低可以对应0和1,也就是二进制语言
二.数据路链层
由来:单纯的0和1是没有意义的 必须规定电信号多少位一组 每组代表什么含义===>
进而推导出以太网呢协议
以太网协议:
以太网协议(Ethernet)工作在数据链路层,其规定了电信号分组方式,以及一组电信号应该包含哪些内容
thernet规定如下:
-
一组电信号构成一个数据包,叫做‘帧’
-
每一数据帧分成:报头head和数据data两部分
head包含:(固定18个字节)
-
发送者/源地址,6个字节
-
接收者/目标地址,6个字节
-
数据类型(标签+以太类型),6个字节
data包含:(最短46字节,最长1500字节)
-
数据包的具体内容
head长度+data长度=最短64字节,最长1518字节,超过最大限制就分片发送
mac地址:
head中包含的源和目标地址指的是什么地址呢?
ethernet规定接入internet的设备都必须具备网卡,发送端和接收端的地址便是指网卡的地址,即mac地址
mac地址:每块网卡出厂时都被烧制上一个世界唯一的mac地址,长度为48位2进制,通常由12位16进制数表示(前六位是厂商编号,后六位是流水线号)
广播:
有了mac地址,同一网络内的两台主机就可以通信了
ethernet采用最原始的方式,广播的方式进行通信,即计算机通信基本靠吼
广播有什么问题吗?如果这个网络中有100台电脑,大家都在同一时间都在互相通讯,那是什么情况,
相当于村头挂着100个大喇叭,大家都在使劲喊,结果是要听清楚说的什么内容非常费劲儿
广播的问题:1没有一台交互机可以容纳所有计算机 故广播的传播范围有限
2:同时传递时速度受到限制 且浪费网络资源
交换机的主动学习:
第一次链接某计算机时 必须广播获取MAC地址
只要链接过一次 MAC地址就被交换机记录下了下一次就不用广播了
三.网络层
1 网络层的由来
有了ethernet、mac地址、广播的发送方式,世界上的计算机就可以彼此通信了
2.以太网通讯存在的问题:
世界范围的互联网是由一个个彼此隔离的小的局域网组成的,如果所有的计算机都采用以太网的广播方式来寻找其他计算机,那么一台机器发送的包全世界都会收到,这就不仅仅是效率低的问题了,这会是一种灾难,(广播风暴就是这么产生的)
结论:必须找出一种方法来区分哪些计算机属于同一广播域,哪些不是,如果是就采用广播的方式发送,如果不是,就采用路由的方式(向不同广播域/子网分发数据包),mac地址是无法区分的,它只跟厂商有关;
网络层功能:引入一套新的地址用来区分不同的广播域/子网,这套地址即网络地址,网络地址到底长什么样,又是如何区分子网的?
3.1 IP地址(重点)
-
ip协议定义的地址称之为ip地址,广泛采用的v4版本即ipv4,它规定网络地址由32位2进制表示
-
范围0.0.0.0-255.255.255.255
-
一个ip地址通常写成四段十进制数,例:192.168.10.1
-
网络号:标识子网 (一般前三段)
-
主机号:标识主机
IP地址的分类:
A类保留给政府机构
1.0.0.0---126.0.0.0
B类分配给中等规模公司
128.0.0.0---191.255.0.0
C类分配给任何需要的人
192.168.0.1 - 192.168.255.254
D类用于组播
E类用于实验
我们的电脑ip通常都是C类的,以192.168开头,正因为C类任何人都可以用
3.2 子网掩码(了解)
什么是子网掩码
子网掩码是一个32位地址,用于屏蔽IP地址的一部分以区别网络标识和主机标识,并说明该IP地址是在局域网上,还是在远程网上。
它的网络部分全部为1,主机部分全部为0。比如,IP地址172.16.10.1,如果已知网络部分是前24位,主机部分是后8位,那么子网络掩码就是11111111.11111111.11111111.00000000,写成十进制就是255.255.255.0。
为什么需要子网掩码
单纯的ip地址段只是标识了ip地址的种类,无法辨识一个ip所处的子网
例:192.168.10.1与192.168.10.2并不能确定二者处于同一子网,因为不清楚哪些位表示网络号,哪些表示主机号
子网掩码如何判断两个ip是否属于同一个子网
知道”子网掩码”,我们就能判断,任意两个IP地址是否处在同一个子网络。方法是将两个IP地址与子网掩码分别进行AND运算(两个数位都为1,运算结果为1,否则为0),然后比较结果是否相同,如果是的话,就表明它们在同一个子网络中,否则就不是。
案例: 已知IP地址172.16.10.1和172.16.10.2的子网掩码都是255.255.255.0,请问它们是否在同一个子网络?两者与子网掩码分别进行AND运算,
172.16.10.1:10101100.00010000.00001010.000000001
255255.255.255.0:11111111.11111111.11111111.00000000
AND运算得网络地址结果:10101100.00010000.00001010.000000001->172.16.10.0
172.16.10.2:10101100.00010000.00001010.000000010
255255.255.255.0:11111111.11111111.11111111.00000000
AND运算得网络地址结果:10101100.00010000.00001010.000000001->172.16.10.0
结果都是172.16.10.0,因此它们在同一个子网络。
总结一下,IP协议的作用主要有两个,一个是为每一台计算机分配IP地址,另一个是确定哪些地址在同一个子网络。
3.3 IP数据包(了解)
ip数据包也分为head和data部分,无须为ip包定义单独的栏位,直接放入以太网包的data部分
head:长度为20到60字节
data:最长为65,515字节。
而以太网数据包的”数据”部分,最长只有1500字节。因此,如果IP数据包超过了1500字节,它就需要分割成几个以太网数据帧,分开发送了。
3.4 ARP协议(了解)
ARP协议的由来:IP是通常是动态分配的,是一个逻辑地址,而数据传输则必须依赖MAC地址,那如何才能通过IP得到对方的MAC地址呢? 这就需要ARP协议了
arp协议功能:广播的方式发送数据包,获取目标主机的mac地址
首先明确每台主机ip都是已知的,并可以通过子网掩码来判断是否属于同一子网
案例1:主机192.168.1.101访问192.168.1.102
是同一子网内 ARP请求帧内容:
1.FF:FF:FF:FF:FF:FF是一个特殊的MAC地址 交换机在看到这个地址时会将这个数据向网内所有主机进行广播
2.192.168.1.102 收到ARP请求后 回复自己的MAC给 源MAC主机
3.发送方(192.168.1.101)收到回复后,会将对方的ip的MAC地址映射关系存储到缓存中,以便下次使用
ps:arp -a 可以查看ARP缓存列表
确定对方MAC地址后的数据帧内容:
案例2:主机192.168.1.101访问192.168.111.101
交换机发现目标IP不在当前子网中,
1.交换机发起ARP请求,将目标IP设置为对方的网关IP,默认情况下,网关的主机号都为1; 所以接收方(192.168.111.101)的网关为192.168.111.1
发送方交换机发起的ARP数据帧:
2.对方网关收到请求后发现ip是自己的ip则回复ARP请求,将其MAC地址告知发送方交换机,
3.发送方交换机将,对方的网关与的MAC地址与IP存储到自己的ARP缓存中,
4.告知发送方(192.168.1.101)对方网关的MAC地址,发送方同样将对方网关MAC与目标IP映射关系存储到,本机ARP缓存中
至此ARP请求结束可以开始传输数据
后续确定了MAC地址后发送的数据帧内容:
总结:ARP通过广播的方式来获取MAC地址, 不在同一子网时 ARP得到的时对方网关的MAC地址,数据到达对方网关后,由网关根据IP交给对应的主机,当然对方网关获取主机MAC也是通过ARP
ps:路由器 交换机都可以称之为网关!
四.传输层(重点)
传输层的由来:
通过物理层ji建立链接通道
通过数据链路层的MAC,可以定位到某个局域网中的某台主机,
通过网络层的IP地址,子网掩码,可以定位到全球范围某一局域网下的某台主机
那么问题来了:
一台计算机上是不可能只运行一个应用程序的,比如同时登陆qq和微信,那接收到的数据到底是交给微信还是qq呢?
答案就是:端口号,端口是需要联网的应用程序与网卡关联的编号
传输层功能:建立端口到端口的通信
补充:端口范围0-65535,0-1023为系统占用端口
TCP与UDP是工作在传输层的协议:
TCP协议
可靠传输,TCP数据包没有长度限制,理论上可以无限长,但是为了保证网络的效率,通常TCP数据包的长度不会超过IP数据包的长度,以确保单个TCP数据包不必再分割。
TCP之所以可靠,是因为在传输数据前需要三次握手确认建立链接
三次握手:
三次握手的过程实际上实在确认我发的你能收到,你发的我也能收到,从而保证数据传输的的可靠性,
链接是一个虚拟的概念,不实际存在,只要三次握手成功即表示连接建立成功!
问题是三次握手时的确能保障数据传输是可靠的,那么握手后的数据要如何保证传输成功呢?
TCP协议要求在发送数据后,必须接收到对方的回复信息才能确认数据成功发送,如果一段时内没有收到回复信息,会自动重新发送,如果重试的次数过多则表示链接可能已经中断!
四次挥手:
四次挥手的目的是保证双方的数据传输已经全部完成,同样是为了保证数据的完整性
总结
其优点很明显:能够保证数据传输是完整的
缺点:由于每次都需要传输确认信息,导致传输效率降低
场景:多用于必须保证数据完整性的场景,例如文本信息,支付信息等!
UDP协议
不可靠传输,”报头”部分一共只有8个字节,总长度不超过65,535字节,正好放进一个IP数据包。
UDP协议采取的方式与TCP完全不同,其根本不关心,对方是否收到数据,甚至不关心,对方的地址是否有效,只要将数据报发送到网络,便什么都不管了!
总结
优点:由于不需要传输确认信息,所以传输效率高于TCP协议
缺点:传输数据可能不完整
场景:视频聊天,语音聊天等,不要求数据完整性,但是对传输速度要求较高
五.应用层
应用层由来:用户使用的都是应用程序,均工作于应用层,互联网是开放的,大家都可以开发自己的应用程序,用什么样的数据格式来传输,就需要由应用程序开发者自己来制定
应用层功能:规定应用程序的数据格式。
例:TCP协议可以为各种各样的程序传递数据,比如Email、WWW、FTP等等。那么,必须有不同协议规定电子邮件、网页、FTP数据的格式,这些应用程序协议就构成了”应用层”。
至此一连串高低电压就通过层层协议,变成了我们在应用程序中看到的各种数据