负载均衡 Load balancing
负载平衡(Load balancing)是一种计算机技术,用来在多个计算机(计算机集群)、网络连接、CPU、磁盘驱动器或其他资源中分配负载,以达到最优化资源使用、最大化吞吐率、最小化响应时间、同时避免过载的目的。 使用带有负载平衡的多个服务器组件,取代单一的组件,可以通过冗余提高可靠性。负载平衡服务通常是由专用软件和硬件来完成。 主要作用是将大量作业合理地分摊到多个操作单元上进行执行,用于解决互联网架构中的高并发和高可用的问题。
简而言之,我们不使用负载均衡的网络服务,只有一个服务器,这个服务器承担着所有的任务。如果突然访问量很大,可能会达到服务器的处理能力上限,会变得卡顿;如果服务器突然碰上了内部错误,死机后则会导致所有的用户都无法继续访问服务。
如果说一台网页服务器server_1.mcoder.cc 192.168.1.100
可以同时提供一百万的用户访问,那么当同时访问的用户量达到一百五十万时,这个网页服务器变会碰上性能瓶颈,可能所有用户的体验都不够好。这时我们可以选择简单的增加一台服务器server_2.mcoder.cc 192.168.1.101
,对用户进行分流,如果两台机器均分用户,则每台只用服务七十五万的用户,在网页服务器的能力范围内,所有用户都能获得很好的体验。而如何让用户选择哪个服务器提供服务便是负载均衡服务器做的工作。负载均衡服务器对外仅是一台