写在前面
本文隶属于专栏《100个问题搞定大数据理论体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!
本专栏目录结构和文献引用请见100个问题搞定大数据理论体系
解答
1. HTTP重定向
2. DNS域名解析
3. 反向代理服务器
4. 网络层
5. 链路层
补充
HTTP重定向
负载均衡服务器使用某种负载均衡算法计算得到服务器的P地址之后,将该地址写入HTTP重定向报文中,状态码为302。
客户端收到重定向报文之后,需要重新向服务器发起请求。
缺点
- 需要两次请求,因此访问延迟比较高;
- HTTP负载均衡器处理能力有限,会限制集群的规模。
使用场景
该负载均衡转发的缺点比较明显,实际场景中很少使用它。
DNS域名解析
在DNS解析域名的同时使用负载均衡算法计算服务器IP地址。
优点
DNS能够根据地理位置进行域名解析,返回离用户最近的服务器IP地址
缺点
由于DNS具有多级结构,每一级的域名记录都可能被缓存,当下线一台服务器需要修改DNS记录时,需要过很长一段时间才能生效。
使用场景
大型网站基本使用了DNS做为第一级负载均衡手段,然后在内部使用其它方式做第二级负载均衡。
也就是说,域名解析的结果为内部的负载均衡服务器IP地址。
反向代理服务器
反向代理服务器位于源服务器前面,用户的请求需要先经过反向代理服务器才能到达源服务器。
反向代理可以用来进行缓存、日志记录等,同时也可以用来做为负载均衡服务器。
在这种负载均衡转发方式下,客户端不直接请求源服务器,因此源服务器不需要外部IP地址,而反向代理需要配置內部和外部两套IP地址。
优点
与其它功能集成在一起,部署简单。
缺点
所有请求和响应都需要经过反向代理服务器,它可能会成为性能瓶颈。
网络层
在操作系统内核进程获取网络数据包,根据负载均衠算法计算源服务器的P地址,并修改请求数据包的目的IP地址,最后进行转发。
源服务器返回的响应也需要经过负载均衡服务器,通常是让负载均衡服务器同时作为集群的网关服务器来实现。
优点
在内核进程中进行处理,性能比较高。
缺点
和反向代理一样,所有的请求和响应都经过负载均衡服务器,会成为性能瓶颈。
链路层
在链路层根据负载均衡算法计算源服务器的MAC地址,并修改请求数据包的目的MAC地址,并进行转发。
通过配置源服务器的虚拟IP地址和负载均衡服务器的IP地址一致,从而不需要修改IP地址就可以进行转发。
优点
也正因为IP地址一样,所以源服务器的响应不需要转发回负载均衡服务器,可以直接转发给客户端,避免了负载均衡服务器的成为瓶颈。
这是一种三角传输模式,被称为直接路由。
对于提供下载和视频服务的网站来说,直接路由避免了大量的网络传输数据经过负载均衡服务器。
使用场景
这是目前大型网站使用最广负载均衡转发方式,在 Linux平台可以使用的负载均衡服务器为LVS(Linux Virtual Server)