一.CDN简介
首先,什么是CDN,Content Delivery Network,基于内容的分布式分发网络,当下的互联网应用都包含大量的静态内容,但静态内容以及一些准动态内容又是最耗费带宽的,特别是针对全国甚至全世界的大型网站,如果这些请求都指向主站的服务器的话,不仅是主站服务器受不了,单端口500M左右的带宽也扛不住,所以大多数网站都需要CDN服务。那么什么是CDN服务?简单的说CDN就是让原本上海的浏览器要访问北京主站内容的请求转而由部署在上海或南京的缓存来受理,这样请求的数据只需经过一跳或有限的几跳就能到达请求端,有效利用带宽并且降低主站压力,对于电子商务网站和搜索引擎网站以及门户网站,CDN的合理应用显得尤为重要。一般需要CDN服务的网站会选择以下的组织方案:1.通过租用的IDC提供额外的CDN服务;2..购买专业的CDN服务商的服务;3.自己组建CDN网络;成本依次增高。CDN设计目的是实现WEB内容的负载均衡,防止出现访问请求热点,延时响应等WEB请求通病。基于此,CDN的特点可以说有
1. 分布式存储
2. 通过智能DNS解析或http重定向实现内容分发的负载均衡
3. 全局负载均衡管理与内容管理
二.CDN网络结构
CDN网络一般分为中心与边缘节点两部分,中心负责全局负载均衡管理与内容管理;
中心节点的功能如下:
1. 随时监控边缘节点的健康状况(可用性,拥塞程度);
2. 根据边缘节点到请求端的距离,以及边缘节点的健康状况,按一定的策略重定向请求;
3. 与客户主站进行数据同步。
三.CDN工作原理
4. 在描述CDN的实现原理,让我们先看传统的未加缓存服务的访问过程,以便了解CDN缓存访问方式与未加缓存访问方式的差别:
由上图可见,用户访问未使用CDN缓存网站的过程为:
1. 用户向浏览器提供要访问的域名;
2. 浏览器调用域名解析函数库对域名进行解析,以得到此域名对应的IP地址;
3. 浏览器使用所得到的IP地址,域名的服务主机发出数据访问请求;
4. 浏览器根据域名主机返回的数据显示网页的内容。
通过以上四个步骤,浏览器完成从用户处接收用户要访问的域名到从域名服务主机处获取数据的整个过程。CDN网络是在用户和服务器之间增加Cache层, 如何将用户的请求引导到Cache上获得源服务器的数据,主要是通过接管DNS实现,下面让我们看看访问使用CDN缓存后的网站的过程:
通过上图,我们可以了解到,使用了CDN缓存后的网站的访问过程变为:
1. 用户向浏览器提供要访问的域名;
2. 浏览器调用域名解析库对域名进行解析,由于CDN对域名解析过程进行了调整,所以解析函数库一般得到的是该域名对应的CNAME记录,为了得到实 际IP地址,浏览器需要再次对获得的CNAME域名进行解析以得到实际的IP地址;在此过程中,使用的全局负载均衡DNS解析,如根据地理位置信息解析对 应的IP地址,使得用户能就近访问。
3. 此次解析得到CDN缓存服务器的IP地址,浏览器在得到实际的IP地址以后,向缓存服务器发出访问请求;
4. 缓存服务器根据浏览器提供的要访问的域名,通过Cache内部专用DNS解析得到此域名的实际IP地址,再由缓存服务器向此实际IP地址提交访问请求;
5. 缓存服务器从实际IP地址得得到内容以后,一方面在本地进行保存,以备以后使用,二方面把获取的数据返回给客户端,完成数据服务过程;
客户端得到由缓存服务器返回的数据以后显示出来并完成整个浏览的数据请求过程。四.CDN流程结构