构建高可用的系统

最新推荐文章于 2021-01-05 11:34:46 发布

超级谷歌

最新推荐文章于 2021-01-05 11:34:46 发布

阅读量2.6k

点赞数 2

分类专栏：架构和设计模式系统优化文章标签：磁盘存储系统负载均衡网络 unix system

本文链接：https://blog.csdn.net/it_man/article/details/7474953

版权

架构和设计模式同时被 2 个专栏收录

62 篇文章 0 订阅

订阅专栏

系统优化

11 篇文章 0 订阅

订阅专栏

今天又温习了一下《分布式java应用》，好多名词看了都知道，但记不住，是不习惯记这些不易理解的专业术语呀。因为和客户说的时候他肯定不懂。但和懂技术的客户或者专家进行沟通的时候都是用这些专业术语，这时候我知道但往往想不起来，看来老了啊。看来以后还得记些，不然显得本架构师不专业呀。

好了，言归正传，如何构建高可用的系统呢？

首先什么是高可用？“高可用性”（High Availability）通常来描述一个系统经过专门的设计，从而减少停工时间，而保持其服务的高度可用性。

1.ha

1.1避免单点

。负载均衡技术

。热备

。使用多机房

1.2提高应用可用性

1.2.1尽可能的避免故障

1.2.2及时发现故障

。报警系统

。日志记录和分析系统

1.2.3访问量和数据量不断上涨的应对策略

。水平伸缩

。拆分--1.应用拆分；2.拆分数据库；拆分表。

。读写分离

。垂直伸缩

。其他

以上高级知识点看了两遍觉得还是得继续修炼，毕竟实战经验很少。

------------------------------------------------------------------------

高可用性的衡量指标

可用性的计算公式：　　%availability=（Total Elapsed Time－Sum of Inoperative Times）/ Total Elapsed Time 　
　elapsed time为operating time+downtime。　　
可用性和系统组件的失败率相关。衡量系统设备失败率的一个指标是“失败间隔平均时间”MTBF（mean time between failures）。
通常这个指标衡量系统的组件，如磁盘。
　　MTBF=Total Operating Time / Total No. of Failures 　　
Operating time为系统在使用的时间（不包含停机情况）。

高可用性系统的设计

计系统的可用性，最重要的是满足用户的需求。系统的失败只有当其导致服务的失效性足以影响到系统用户的需求时才会影响其可用性的指标。用户的敏感性决定于系统提供的应用。例如，在一个能在1秒钟之内被修复的失败在一些联机事务处理系统中并不会被感知到，但如果是对于一个实时的科学计算应用系统，则是不可被接受的。

　　系统的高可用性设计决定于您的应用。例如，如果几个小时的计划停机时间是可接受的，也许存储系统就不用设计为磁盘可热插拔的。反之，你可能就应该采用可热插拔、热交换和镜像的磁盘系统。

　　所以涉及高可用系统需要考虑：

　　决定业务中断的持续时间。根据公式计算出的衡量HA的指标，可以得到一段时间内可以中断的时间。但可能很大量的短时间中断是可以忍受的，而少量长时间的中断却是不可忍受的。

　　在统计中表明，造成非计划的宕机因素并非都是硬件问题。硬件问题只占40%，软件问题占30%，人为因素占20%，环境因素占10%。您的高可用性系统应该能尽可能地考虑到上述所有因素。

　　当出现业务中断时，尽快恢复的手段。