计算机速成课Crash Course - 29. 互联网

今天继续计算机速成课Crash Course的系列讲解。

更多技术文章,全网首发公众号 “极客之昂” 锁定 -上午11点 - ,感谢大家关注、转发、点赞!

29. 互联网

上集讲到,你的计算机和一个巨大的分布式网络连在一起,这个网络叫互联网,你现在就在网上看视频呀。

图片

互联网由无数互联设备组成,而且日益增多,计算机为了获取这个视频,首先要连到局域网,也叫 LAN。

你家 WIFI 路由器连着的所有设备,组成了局域网。局域网再连到广域网,广域网也叫 WAN,WAN 的路由器一般属于你的"互联网服务提供商",简称 ISP,比如 Comcast,AT&T 和 Verizon 这样的公司。

图片

广域网里,先连到一个区域性路由器,这路由器可能覆盖一个街区。然后连到一个更大的 WAN,可能覆盖整个城市,可能再跳几次,但最终会到达互联网主干。

互联网主干由一群超大型、带宽超高路由器组成,为了从 YouTube 获得这个视频,数据包(packet)要先到互联网主干,沿着主干到达有对应视频文件的 YouTube 服务器,数据包从你的计算机跳到 Youtube 服务器,可能要跳个10次。先跳4次到互联网主干,2次穿过主干,主干出来可能再跳4次,然后到 Youtube 服务器。

如果你在用 Windows, Mac OS 或 Linux系统,可以用 traceroute 来看跳了几次。

我们在"印第安纳波利斯"的 Chad&Stacy Emigholz 工作室,访问加州的 DFTBA 服务器,经历了11次中转。

从 192.168.0.1 出发,这是我的电脑在 局域网(LAN)里的 IP 地址,然后到工作室的 WIFI 路由器,然后穿过一个个地区路由器,到达主干,然后从主干出来,又跳了几次,到达"DFTBA.com”的服务器。

图片

IP 地址是 104.24.109.186.但数据包到底是怎么过去的?如果传输时数据包被弄丢了,会发生什么?如果在浏览器里输 "DFTBA.com",浏览器怎么知道服务器的地址多少?

我们今天会讨论这些话题。

上集说过,互联网是一个巨型分布式网络,会把数据拆成一个个数据包来传输,如果要发的数据很大,比如邮件附件,数据会被拆成多个小数据包。

举例,你现在看的这个视频,就是一个个到达你电脑的数据包,而不是一整个大文件发过来。

数据包(packet)想在互联网上传输,要符合"互联网协议"的标准,简称 IP,就像邮寄手写信一样,邮寄是有标准的,每封信需要一个地址,而且地址必须是独特的,并且大小和重量是有限制的,违反这些规定,信件就无法送达。

IP 数据包也是如此,因为 IP 是一个非常底层的协议。

数据包的头部(或者说前面)只有目标地址,头部存 "关于数据的数据",也叫 元数据(metadata),这意味着当数据包到达对方电脑,对方不知道把包交给哪个程序,是交给 Skype 还是使命召唤?

图片

因此需要在 IP 之上,开发更高级的协议。这些协议里,最简单最常见的叫"用户数据报协议",简称 UDP。

UDP 也有头部,这个头部位于数据前面,头部里包含有用的信息,信息之一是端口号,每个想访问网络的程序,都要向操作系统申请一个端口号.比如 Skype 会申请端口 3478。

当一个数据包到达时,接收方的操作系统会读 UDP 头部,读里面的端口号,如果看到端口号是 3478,就把数据包交给 Skype。

图片

总结:IP 负责把数据包送到正确的计算机,UDP 负责把数据包送到正确的程序。

UDP 头部里还有"校验和",用于检查数据是否正确,正如"校验和"这个名字所暗示的,检查方式是把数据求和来对比。

以下是个简单例子。

假设 UDP 数据包里,原始数据是 89 111 33 32 58 41,在发送数据包前,电脑会把所有数据加在一起,算出"校验和",89+111+33+... 以此类推。

得到 364,这就是"校验和"。UDP 中"校验和"以 16 位形式存储 (就是16个0或1)。

如果算出来的和,超过了 16 位能表示的最大值,高位数会被扔掉,保留低位。

当接收方电脑收到这个数据包,它会重复这个步骤,把所有数据加在一起,89+111+33... 以此类推。

图片

如果结果和头部中的校验和一致,代表一切正常,如果不一致,数据肯定坏掉了,也许传输时碰到了功率波动,或电缆出故障了。

不幸的是,UDP 不提供数据修复或数据重发的机制,接收方知道数据损坏后,一般只是扔掉。而且,UDP 无法得知数据包是否到达。发送方发了之后,无法知道数据包是否到达目的地。

这些特性听起来很糟糕,但是有些程序不在意这些问题,因为 UDP 又简单又快。

拿 Skype 举例,它用 UDP 来做视频通话,能处理坏数据或缺失数据,所以网速慢的时候 Skype 卡卡的,因为只有一部分数据包到了你的电脑。

图片

但对于其他一些数据,这个方法不适用,比如发邮件,邮件不能只有开头和结尾,没有中间,邮件要完整到达收件方。

如果"所有数据必须到达",就用"传输控制协议",简称 TCP,TCP 和 UDP 一样,头部也在存数据前面。

因此,人们叫这个组合 TCP/IP,就像 UDP ,TCP 头部也有"端口号"和"校验和",但 TCP 有更高级的功能,我们这里只介绍重要的几个。

图片

1. TCP 数据包有序号,15号之后是16号,16号之后是17号,以此类推,发上百万个数据包也是有可能的。序号使接收方可以把数据包排成正确顺序,即使到达时间不同,哪怕到达顺序是乱的,TCP 协议也能把顺序排对。

图片

2. TCP 要求接收方的电脑收到数据包,并且"校验和"检查无误后(数据没有损坏)\N 给发送方发一个确认码,代表收到了。"确认码" 简称 ACK,得知上一个数据包成功抵达后,发送方会发下一个数据包。

图片

假设这次发出去之后,没收到确认码,那么肯定哪里错了,如果过了一定时间还没收到确认码,发送方会再发一次,注意 数据包可能的确到,是确认码延误了很久,或传输中丢失了。

但这不碍事 因为收件方有序列号,如果收到重复的数据包就删掉,还有,TCP 不是只能一个包一个包发,可以同时发多个数据包,收多个确认码,这大大增加了效率,不用浪费时间等确认码。

图片

有趣的是,确认码的成功率和来回时间,可以推测网络的拥堵程度,TCP 用这个信息,调整同时发包数量,解决拥堵问题。

TCP 用这个信息,调整同时发包数量,解决拥堵问题,简单说,TCP 可以处理乱序和丢失数据包,丢了就重发。还可以根据拥挤情况自动调整传输率,相当厉害!

你可能会奇怪,既然 TCP 那么厉害,还有人用 UDP 吗?

TCP 最大的缺点是,那些"确认码"数据包把数量翻了一倍,但并没有传输更多信息,有时候这种代价是不值得的,特别是对时间要求很高的程序,比如在线射击游戏。

如果你玩游戏很卡,你也会觉得这样不值!

当计算机访问一个网站时,需要两个东西:1.IP地址 2.端口号

例如 172.217.7.238 的 80 端口,这是谷歌的 IP 地址和端口号,事实上,你可以输到浏览器里,然后你会进入谷歌首页。

图片

有了这两个东西就能访问正确的网站,但记一长串数字很讨厌,google.com 比一长串数字好记。

所以互联网有个特殊服务,负责把域名和 IP 地址一一对应,就像专为互联网的电话簿,它叫"域名系统",简称 DNS。

它的运作原理你可能猜到了,在浏览器里输 youtube.com,浏览器会去问 DNS 服务器,它的 IP 地址是多少。

一般 DNS 服务器是互联网供应商提供的,DNS 会查表,如果域名存在,就返回对应 IP 地址。

图片

如果你乱敲键盘加个.com 然后按回车,你很可能会看到 DNS 错误,因为那个网站不存在,所以 DNS 无法返回给你一个地址。

如果你输的是有效地址,比如 youtube.com,DNS 按理会返回一个地址,然后浏览器会给这个 IP 地址,发 TCP 请求。

如今有三千万个注册域名,所以为了更好管理,DNS 不是存成一个超长超长的列表,而是存成树状结构。

顶级域名(简称 TLD)在最顶部,比如 .com 和 .gov,下一层是二级域名,比如 .com 下面有google.com 和 dftba.com,再下一层叫子域名,比如 images.google.com, store.dftba.com。

图片

这个树超!级!大!

我前面说的"三千万个域名"只是二级域名,不是所有子域名。因此,这些数据散布在很多 DNS 服务器上,不同服务器负责树的不同部分

好了 我知道你肯定在等这个梗:我们到了一层新抽象!

过去两集里,我们讲了线路里的电信号,以及无线网络里的无线信号,这些叫"物理层",而"数据链路层"负责操控"物理层",数据链路层有:媒体访问控制地址(MAC),碰撞检测,指数退避,以及其他一些底层协议。

再上一层是"网络层",负责各种报文交换和路由,而今天,我们讲了"传输层"里一大部分,比如 UDP 和 TCP 这些协议,负责在计算机之间进行点到点的传输,而且还会检测和修复错误。

我们还讲了一点点"会话层","会话层"会使用 TCP 和 UDP 来创建连接,传递信息,然后关掉连接,这一整套叫"会话",查询 DNS 或看网页时,就会发生这一套流程。

这是 开放式系统互联通信参考模型(OSI) 的底下5层,这个概念性框架 把网络通信划分成多层,每一层处理各自的问题。

图片

如果不分层,直接从上到下捏在一起实现网络通信,是完全不可能的,抽象使得科学家和工程师能分工同时改进多个层,不被整体复杂度难倒。

而且惊人的是!我们还没讲完呢!

OSI 模型还有两层,"表示层"和"应用程序层",其中有浏览器,Skype,HTML解码,在线看电影等。

图片

我们下节课讲。


以上内容就是 29. 互联网 的内容,感兴趣的同学记得点赞、关注、转发、收藏哦!

我会不定期发布课程的讲解!

更多技术文章,全网首发公众号 “极客之昂” 锁定 -上午11点 - ,感谢大家关注、转发、点赞!

  • 13
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

极客之昂-钛

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值