DNS 流程说明以及相关问题的解析

一、流程

流程图如下

如图所示,大致就是:浏览器输入地址,然后浏览器这个进程去调操作系统某个库里的 gethostbyname 函数(例如,Linux GNU glibc 标准库的 gethostbyname 函数),然后呢这个函数通过网卡给 DNS 服务器发 UDP 请求,接收结果,然后将结果给返回给浏览器。

这张图其实已经讲明白大致的流程,但是细节上可能有些差异。 例如

  • 我们在用 chrome 浏览器的时候,其实会先去浏览器的 dns 缓存里头查询,DNS 缓存中没有,再去调用 gethostbyname 函数。
  • gethostbyname 函数在试图进行 DNS 解析之前首先检查域名是否在本地 Hosts 里,如果没找到再去 DNS 服务器上查。

不过,看到这里!请回忆下这两道面试题?

现在,会回答了么?

什么,你还不懂怎么答?把文章拉到开头。从头看过。 不过呢,需要补充说明一下,DNS中也有一个地方用到了 TCP 协议。那就是区域传送

DNS 的规范规定了 2 种类型的 DNS 服务器,一个叫主 DNS 服务器,一个叫辅助 DNS 服务器。在一个区中主 DNS 服务器从自己本机的数据文件中读取该区的 DNS 数据信息,而辅助 DNS 服务器则从区的主DNS 服务器中读取该区的 DNS 数据信息。当一个辅助 DNS 服务器启动时,它需要与主 DNS 服务器通信,并加载数据信息,这就叫做区传送(zone transfer)。 这种情况下,使用TCP协议。

讲到这里。其实面试官是可以深入追问的,如下所示

针对第一问,为什么域名解析用UDP协议?

因为 UDP 快啊!UDP 的 DNS 协议只要一个请求、一个应答就好了。而使用基于 TCP 的 DNS 协议要三次握手、发送数据以及应答、四次挥手。但是 UDP 协议传输内容不能超过 512 字节。不过客户端向DNS 服务器查询域名,一般返回的内容都不超过 512 字节,用 UDP 传输即可。

针对第二问,为什么区域传送用 TCP 协议?

因为 TCP 协议可靠性好啊!你要从主 DNS 上复制内容啊,你用不可靠的 UDP ? 因为 TCP 协议传输的内容大啊,你用最大只能传 512 字节的 UDP 协议?万一同步的数据大于 512 字节,你怎么办?

二、原理

现在,讲最后一块 DNS 解析域名的原理!这块是重中之重! 先介绍 linux 下一个 dig 命令,以显示解析域名的过程。 为了便于说明,我们来 dig 一下天猫的过程

dig www.tmall.com

结果如下图所示

莫方,看不懂没事。 现在我们来读重点的两段。第一段代表请求参数如下图所示

这段为查询内容。 DNS 的查询参数一般有三个

(1)域名:服务器、邮件服务器(邮件地址中 @ 后面的部分)的名称。

(2)Class:在设置 DNS 方案时,互联网之外的网络也考虑到了,而 Class 就是用来识别网络的,不过现在只有互联网,所以它的值永远都是代表互联网的 IN 。

(3)记录类型:标识域名对应何种类型的记录。

  • 类型为 A,表示域名对应的 IP 地址。
  • 类型为 MX 时,表示域名对应的是邮件服务器。
  • 类型为 PTR,表示根据 IP 地址反查域名。
  • 类型为 CNAME,表示查询域名相关别名。

当然,你这个时候要问我一个问题啦(注意上图红框)

烟哥,我输入的明明是 http://www.tmall.com 可是命令里解析的地址是 www.tmall.com. 啊,多了一个 . 的符号啊?这个 . 符号是什么意思呢?

于是乎,又扯了一道经典面试题

OK,好,要讲明白这个问题。我们要先把域名的结构讲清楚! www.tmall.com 对应的真正的域名为 www.tmall.com.。末尾的. 称为根域名,因为每个域名都有根域名,因此我们通常省略。

根域名的下一级,叫做"顶级域名"(top-level domain,缩写为 TLD),比如 .com、.net

再下一级叫做"次级域名"(second-level domain,缩写为 SLD ),比如 www.tmall.com 里面的 .tmall,这一级域名是用户可以注册的;

再下一级是主机名(host),比如 www.tmall.com 里面的 www,又称为"三级域名",这是用户在自己的域里面为服务器分配的名称,是用户可以任意分配的。

那么解析流程就是分级查询

(1)先在本机的 DNS 里头查,如果有就直接返回了。本机 DNS 就是下面这个东东

(2)本机 DNS 里头发现没有,就去根服务器里查。根服务器发现这个域名是属于 com 域,因此根域 DNS 服务器会返回它所管理的 com 域中的 DNS 服务器的 IP 地址,意思是“虽然我不知道你要查的那个域名的地址,但你可以去 com 域问问看”

(3)本机的 DNS 接到又会向 com 域的 DNS 服务器发送查询消息。com 域中也没有 www.tmall.com 这个域名的信息,和刚才一样,com 域服务器会返回它下面的 tmall.com 域的 DNS 服务器的 IP 地址。

以此类推,只要重复前面的步骤,就可以顺藤摸瓜找到目标 DNS 服务器。

ps:温馨提醒,dig trace www.tmall.com 可以看到解析过程。有兴趣的读者,自己实验一下。

扯了那么多东西,我们来看第二段内容,也就是响应体的部分! 如下所示

很明显,第一行就是说 www.tmall.com 有一个别名是 www.tmall.com.danuoyi.tbcache.com。后面几行就是这个 www.tmall.com.danuoyi.tbcache.com 地址的真实 IP。

为什么天猫要设一个别名到 http://www.tmall.com.danuoyi.tbcache.com 地址呢? 于是乎,又一道经典面试题出现

说句实在话,我当初第一眼,见到这题的时候,我觉得应该是方便 cdn 配置。 回到我们的例子,如果烟哥的猜测正确,www.tmall.com.danuoyi.tbcache.com 这个地址,应该是淘宝的一个 cdn 地址。 因此,我特意去查了域名备案记录。如下图所示

果然,就是一个淘宝的cdn环境。

那么这么配有什么好处呢?

唉,这题当思考题,快过来探讨留言!

 

转载于:https://zhuanlan.zhihu.com/p/79350395

 

(SAW:Game Over!)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值