CDN工作原理

1、CDN的产生及作用

        随着时代的发展,网民数量增多,访问路径过长,所以当用户与网站之间的链路被突发的大流量数据拥塞时,不同地区的用户访问网站的响应速度存在差异,为了提高用户访问的响应速度、优化现有Internet中信息的流动,需要在用户和服务器间加入中间层CDN。

        CDN将内容推送到网络边缘,大量的用户访问被分散在网络边缘,不再构成网站出口、互联互通点的资源挤占,也不再需要跨越长距离IP路由,即减少了源服务器的资源占用,企业大大提升了用户访问的响应时间,从而使用户能以最快的速度,从最接近用户的地方获得所需的信息,彻底解决网络拥塞,提高响应速度。

CDN(Content Delivery Network),即内容分发网络。其目的是通过在现有的Internet中增加一层新的CACHE(缓存)层,将网站的内容发布到最接近用户的网络”边缘“的节点,使用户可以就近取得所需的内容,提高用户访问网站的响应速度。从技术上全面解决由于网络带宽小、用户访问量大、网点分布不均等原因,提高用户访问网站的响应速度。

2、访问源站的过程

在浏览器中输入edu.lagou.com,最终会将该域名解析为一个IP地址。

DNS:域名系统,Domain Name System,核心作用就是就是将一个域名解析为IP地址。

为了更加清楚地展示CDN的原理,我们首先回顾一下不使用缓存直接到源站请求数据的过程:

如上图所示,如果要访问的网站名为:"www.edu.lagou.com" 

(1)客户端首先会在本机的hosts文件和hosts缓存中查找该域名对应的IP地址;

(2)如果本机中没有此信息,则会到我们的本地DNS 进行询问该域名对应的IP地址;

(3)如果本地DNS中仍然没有该域名的IP信息时,则会由本地DNS依次向根DNS 、顶级域DNS、权威DNS 进行询问,最终本地DNS 将IP地址发送给客户端。

(4)客户端通过IP地址向远程的源站服务器发出HTTP请求并获取相应的数据内容。

        以上是通过DNS的迭代解析模式获取域名对应的IP地址并发送HTTP请求的过程。源站的提供商通过配置权威DNS将源站的域名与提供服务的服务器主机进行绑定,使客户端通过DNS服务可以顺利地获取源站域名对应的IP地址并通过IP地址与源站进行通信。

3、DNS的记录类型

域名---->IP地址

        在DNS系统中,最常见的资源记录方式是Internet类记录,该记录由包含4个字段的数据构成:Name、Value、Type、TTL。其中Name和Value可以理解为一对键值对,但是其具体含义取决于Type的类型,TTL记录了该条记录应当从缓存中删除的时间。在资源记录的类型中中,最为常见且重要的类型Type主要有: 

A记录(Address)

        A记录用于描述目标域名到IP地址的映射关系,将目标域名与A记录的Name字段进行匹配,将成功匹配的记录的Value字段的内容(IP地址)输出到DNS回应报文中。

NS记录(Name Server) 

        NS记录用于描述目标域名到负责解析该域名的DNS的映射关系,根据目标域名对NS记录的Name字段进行匹配,将成功匹配的记录的Value字段(负责解析目标域名的DNS的IP地址)输出到DNS回应报文中。

CNAME记录

        CNAME记录用于描述目的域名和别名的对应关系,如果说A记录可以将目标域名转换为对应主机的IP地址,那么CNAME记录则可以将一个域名(别名)转换为另一个域名,如果多条CNAME记录指向同一个域名,则可以将多个不同的域名的请求指向同一台服务器主机。并且,CNAME记录通常还对应了一条A记录,用于提供被转换的域名的IP地址。

4、通过CDN获取缓存内容的过程 

CDN将我们对源站的请求导向了距离用户较近的最优缓存节点,而非源站。 

下图所示是通过CDN进行请求响应的过程图。通过图中可以看出:

         在DNS解析域名时新增了一个全局负载均衡系统(GSLB) ,GSLB的主要功能是根据用户的本地DNS(通常距离用户的物理位置较近)的IP地址判断用户的位置,筛选出距离用户较近的本地负载均衡系统(SLB) ,并将该SLB的IP地址作为结果返回给本地DNS。

        SLB主要负责判断缓存服务器集群中是否包含用户请求的资源数据,如果缓存服务器中存在请求的资源,则根据缓存服务器集群中节点的健康程度、负载量、连接数等因素筛选出最优的缓存节点,并将HTTP请求重定向到最优的缓存节点上。

GSLB :Global Server Load Balancing,全局负载均衡服务器。

SLB(Server load balancing):负载均衡服务器是对集群内物理主机的负载均衡,而GSLB是对物理集群的负载均衡。

        为了更清晰地说明CDN的工作原理,下面以客户端发起对"www.edu.lagou.com/index.html"的HTTP请求为例进行说明: 

  1. 用户发起对"www.edu.lagou.com/index.html"的HTTP请求,首先需要通过本地DNS通过"迭代解析"的方式获取域名"edu.lagou.com"的IP地址;
  2. 如果本地DNS的缓存中没有该域名的记录,则向根DNS 发送DNS查询报文;
  3. 根DNS 发现域名的前缀为"com",则给出负责解析com 的顶级DNS 的IP地址;
  4. 本地DNS向顶级DNS 发送DNS查询报文;
  5. 顶级DNS 发现域名的前缀为"lagou.com",在本地记录中查找负责该前缀的权威DNS 的IP地址并进行回复;
  6. 本地DNS向权威DNS 发送DNS查询报文;
  7. 权威DNS查找到一条NAME字段为"edu.lagou.com"的CNAME记录(由服务提供者配置,阿里云、网宿科技),该记录的Value字段为"edu.lagou.cdn.com";并且还找到另一条NAME字段为"edu.lagou.cdn.com"的A记录(域名-->IP),该记录的Value字段为GSLB的IP地址;
  8. 本地DNS向GSLB发送DNS查询报文;
  9. GSLB根据本地DNS 的IP地址判断用户的大致位置为北京,筛选出位于海淀区且综合考量最优的SLB的IP地址填入DNS回应报文,作为DNS查询的最终结果;
  10. 本地DNS回复客户端的DNS请求,将上一步的IP地址作为最终结果回复给客户端;
  11. 客户端根据IP地址向SLB发送HTTP请求:"www.edu.lagou.com/index.html";
  12. SLB综合考虑缓存服务器集群中各个节点的资源限制条件、健康度、负载情况等因素,筛选出最优的缓存节点后回应客户端的HTTP请求(状态码为302,重定向地址为最优缓存节点的IP地址);
  13. 客户端接收到SLB的HTTP回复后,重定向到该缓存节点上;
  14. 缓存节点判断请求的资源是否存在、过期,将缓存的资源直接回复给客户端,否则到源站进行数据更新再回复。

一个普通的DNS请求:

        ① 用户提交域名
        ② 客户端解析域名
        ③ DNS服务器解析出IP
        ④ 客户端请求IP
        ⑤ 返回结束

加入了GSLB的请求:

        ① 提交域名
        ② 客户端解析域名
        ③ NS(name server,将域名解析到另一个)解析到GSLB
        ④ GSLB解析并返回IP
        ⑤ 客户端请求IP
        ⑥ 返回结束

5、CDN的网络架构

CDN网络架构主要由两大部分,分为中心和边缘两部分:

        中心指CDN网关中心和DNS重定向解析中心,负责全局负载均衡,设备系统安装在管理中心机房。

边缘主要指异地节点,CDN分发的载体,主要由Cache和负载均衡器等组成。

中心:CDN网关中心、DNS重定向解析中心

边缘:Cache、负载均衡器

        当用户访问加入CDN服务的网站时,域名解析请求将最终交给全局负载均衡DNS进行处理。全局负载均衡DNS通过一组预先定义好的策略,将当时最接近用户的节点地址提供给用户,使用户能够得到快速的服务。同时,它还与分布在世界各地的所有CDN节点保持通信,搜集各节点的通信状态,确保不将用户的请求分配到不可用的CDN节点上,实际上是通过DNS做全局负载均衡。

        对于普通的Internet用户来讲,每个CDN节点就相当于一个放置在它周围的WEB。通过全局负载均衡DNS的控制,用户的请求被透明地指向离他最近的节点,节点中CDN服务器会像网站的原始服务器一样,响应用户的请求。由于它离用户更近,因而响应时间必然更快。

每个CDN节点由两部分组成:负载均衡设备和高速缓存服务器

        负载均衡设备负责每个节点中各个Cache的负载均衡,保证节点的工作效率;同时,负载均衡设备还负责收集节点与周围环境的信息,保持与全局负载DNS的通信,实现整个系统的负载均衡。

        高速缓存服务器(Cache)负责存储客户网站的大量信息,就像一个靠近用户的网站服务器一样响应本地用户的访问请求。

        理论上,最简单的CDN网络有一个负责全局负载均衡的DNS和各节点一台Cache,即可运行。DNS支持根据用户源IP地址解析不同的IP,实现就近访问。为了保证高可用性等,需要监视各节点的流量、健康状况等。一个节点的单台Cache承载数量不够时,才需要多台Cache,多台Cache同时工作,才需要负载均衡器,使Cache群协同工作。

6、CDN相关术语

源站:指发布内容的原始站点,也就是做 CDN 之前客户真正的服务器。

边缘服务器(Edge Server):对于边缘服务器,CDN提供了就近访问的能力,边缘服务器节点就是实际提供给用户就近连接、访问的服务器。

CDN命中率:CDN一般提供的是静态加速能力,静态加速能力通常通过缓存架构来实现,CDN命中指的是CDN服务器有该资源缓存存在,请求到达CDN节点时,CDN服务器可以在本地缓存获取资源直接返回客户端,如果没有命中,则需要CDN节点到源站获取资源。CDN命中的概率即CDN命中率。

回源:当CDN没有命中缓存时,需要到源站去获取资源,这个过程称为回源,回源需要从CDN节点层层代理访问,最终到源站获取资源。

中间层服务器:边缘节点比较松散,因此存在缓存穿透的问题。为了避免回源引起的性能大幅下降,在CDN的中间层服务器将多个CDN节点的访问进行收敛,从而大幅提高命中率。

7、CDN应用场景

1、网页站点加速

        网站或应用App的主要业务为图片和小文件下载,包括各类型图片、html、css、js小文件等。

2、下载加速 

        网站或应用App的主要业务为大文件下载,平均单个文件大小在20M以上,如游戏、各类客户端下载和App下载商店等。

3、视频点播 

        网站或应用App的主要业务为视频点播或短视频类。支持MP4、FLV等主流视频格式。

4、视频直播 

5、移动加速 

  • 0
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

悠然予夏

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值