Hystrix的正确理解方式-CSDN博客

　　hystrix-logo-tagline-640.png

　　什么是熔断器

　　熔断器，原本是电路中在电器发生短路时的防止电路过载的开关装置，它切断发生短路的电路，从而防止因电路过载导致的发热起火等灾难的发生。同样的，在为服务中也可能出现类似电路中短路的事故发生，所以为了防止类似的灾难的发生，Hystrix(微服中的熔断器)为此而被设计出来。

　　官方的定义

　　以下是官方对hystrix的定义：

　　In a distributed environment, inevitably some of the many service dependencies will fail. Hystrix is a library that helps you control the interactions between these distributed services by adding latency tolerance and fault tolerance logic. Hystrix does this by isolating points of access between the services, stopping cascading failures across them, and providing fallback options, all of which improve your system’s overall resiliency.

　　以下是我的翻译：

　　在分布式环境中，服务之间的调用不可避免地会失败(网络原因、服务器异常等 )。Hystrix是一个在分布式环境中通过增加延迟性和容错来帮助你控制这些服务之间的交互。Hystrix是通过隔离服务之间的访问，阻止服务间的连锁故障，并提供可选项配置，所有这些旨在提高您微服系统的整体弹性。

　　(以上仅表示我个人的翻译，如果有高见欢迎评论)

　　Hystrix的历史

　　Hystrix是由Netflix Api团队的一个开始于2011年提高服务弹性的项目演变而来的，在2012年Hystrix不断的发展和成熟，在Netflix团队中也有越来越多的项目使用到Hystrix.如今，在Netflix每天有成千上万的线程分离和数百亿的信号分离的调用是通过Hystrix完成的。也因此系统的正常运行时间和弹性得到了显著的提高。

　　Hystrix被设计用来做什么?

　　提供保护和控制过度的延迟和依赖失败。

　　在复杂的分布式系统中防止级联失败。

　　使失败快速结束和快速恢复(Fail fast and rapidly recover)。

　　回退和尽可能优雅的降级。

　　提供短近乎实时的监控、警报和操作控制。

　　Hystrix可以解决什么问题?

　　在官方文档的介绍中举了一个这样的例子，假设一个应用依赖30个微服务，并且这30个微服的正常运行时间高达99.99%(这对于一个微服来说表现已经很不错了)。这样的情况下，我们能得到这样的结论：

　　99.99的30次方 = 99.7% 正常运行时间

　　如果有10亿次请求则有3,000,000次的失败请求

　　即使所依赖的30个服务都表现很棒，每个月还是有2小时的停机时间

　　这是在我们假设的依赖的服务表现很棒的情况下，还是会有每月2小时的宕机，在实际的生产环境中情况肯定要比这个更糟糕，尤其对于一些金融或是对服务稳定要求较高的行业，这样的情况是不能允许的。由此可见Hystrix在微服中的重要作用。