代理
也就是只正向代理,正向代理的过程,它隐藏了真实的请求客户端,服务端不知道真实的客户端是谁,客户端请求的服务都被代理服务器代替来请求。
反向代理
反向代理隐藏了真实的服务端,当我们请求 www.baidu.com 的时候,就像拨打10086一样,背后可能有成千上万台服务器为我们服务,但具体是哪一台,你不知道,也不需要知道,你只需要知道反向代理服务器是谁就好了,www.baidu.com 就是我们的反向代理服务器,反向代理服务器会帮我们把请求转发到真实的服务器那里去。
两者的区别在于代理的对象不一样:正向代理代理的对象是客户端,反向代理代理的对象是服务端。
在计算机世界里,由于单个服务器的处理客户端(用户)请求能力有一个极限,当用户的接入请求蜂拥而入时,会造成服务器忙不过来的局面,可以使用多个服务器来共同分担成千上万的用户请求,这些服务器提供相同的服务,对于用户来说,根本感觉不到任何差别。
反向代理的实现
1)需要有一个负载均衡设备来分发用户请求,将用户请求分发到空闲的服务器上
2)服务器返回自己的服务到负载均衡设备
3)负载均衡将服务器的服务返回用户
以上的潜台词是:用户和负载均衡设备直接通信,也意味着用户做服务器域名解析时,解析得到的IP其实是负载均衡的IP,而不是服务器的IP,这样有一个好处是,当新加入/移走服务器时,仅仅需要修改负载均衡的服务器列表,而不会影响现有的服务。
谈完反向代理服务,再来谈谈终端用户常用的代理服务。
代理
1)用户希望代理服务器帮助自己,和要访问服务器通信,为了实现此目标,需要以下工作:
a) 用户IP报文的目的IP = 代理服务器IP
b) 用户报文端口号 = 代理服务器监听端口号
c) HTTP 消息里的URL要提供服务器的链接
2)代理服务器可以根据 c) 里的链接与服务器直接通信
3)服务器返回网页
4)代理服务器打包 3) 中的网页,返回用户。
代理服务器应用场景
场景一
如果不采用代理,用户的IP、端口号直接暴露在Internet(尽管地址转换NAT),外部主机依然可以根据IP、端口号来开采主机安全漏洞,所以在企业网,一般都是采用代理服务器访问互联网。
那有同学会有疑问,那代理服务器就没有安全漏洞吗?
相比千千万万的用户主机,代理服务器数量有限,修补安全漏洞更方便快捷。
场景二
在一个家庭局域网,家长觉得外部的世界是洪水猛兽,为了不让小盆友们学坏,决定不让小盆友们访问一些网站,可小盆友们有强烈的逆反心理,越是不让我看,我越是想看,于是小盆友们使用了代理服务器,这些代理服务器将禁止访问的网页打包好,然后再转交给小盆友,仅此而已。
当然关键的关键是代理服务器不在禁止名单当中!
更新部分
计算机世界的代理
众所周知,传统的计算机网络访问模型,是客户/服务器模式。
Client ---- Server
但在某些场景下,客户并不希望将自己的真实IP暴露在服务器的面前,所以希望让自己的代理与服务器打交道。
Client ---- > Proxy ---- Server
注意上方的箭头方向。
计算机世界的反向代理
上文提到了,单个服务器的单兵作战模式已经无法满足海量的客户连接请求,需要用服务器集群(cluster)来分摊客户的海量连接,问题来了,集群里的服务器IP地址不一样,如何让客户端通过唯一的网址得到这些不同的IP地址,客户端只有获得了不同的服务器IP地址,负载均衡才有可能,对吗?
智能域名解析(DNS)
每次DNS服务器接收到公司的域名解析请求,将根据每个服务器的负载状态,将域名解析到负载最轻的服务器IP地址上,然后客户端就可以连接服务器IP了。
这种解决方案,要求智能DNS服务器与真正的服务器有互动,可以实时采样服务器的负载状况。
此外,当服务器有多个公网IP,多个公网IP分别属于不同的运营商网络,智能DNS可以根据客户端的IP属于哪个运营商的,然后返回同样运营商的IP,这样客户访问处在同一个网络里服务器的IP,访问更快更高效。
负载均衡
将负载均衡设备放置在服务器与客户端之间,如下所示:
Client ---- > Proxy ----- Load Balance <---- Server
注意上图右侧的箭头与左侧的箭头正好是反向的,所以Load Balance通常被看做是与Proxy反向的设备,即反向代理(Reverse Proxy)。
智能DNS将公司的网址解析到Load Balance设备的IP,那么客户、或者客户的代理的连接将被导流到Load Balance设备上去,Load Balance再根据每台服务器的负载状况,来决定选择哪台服务器来真正响应客户连接请求。
如果客户端使用了代理,那么就会有三个顺序连接的TCP会话形成:
(1)Client ---- Proxy
(2)Proxy ---- LoadBalance
(3)Load Balance ---- Server
客户端与服务器本来只是一个端到端的TCP连接,在这里却演变成三个TCP连接串联在一起。
智能DNS与负载均衡并不冲突,可以组合在一起使用。当有多个负载均衡集群时,可以依赖智能DNS服务器将域名解析平均分摊到每个集群上去,从而实现动态智能流量分发。