网易视频云:也谈过载保护和隔离

什么是过载,会有什么危害? 腾讯后台开发技术总监bison[1]给出了一个很好的定义:对于时延敏感的服务,当外部请求超过系统处理能力,如果系统没有做相应保护,可能导致历史累计的超时请求达到一定规模,像雪球一样形成恶性循环。由于系统处理的每个请求都因为超时而无效,系统对外呈现的服务能力为0,且这种情况下不能自动恢复

过载的这么危险,应该怎么处理?我认为应该从过载保护过载隔离两个方面来解决。

一、过载保护

过载保护的关注点是在过载情况下,如何尽其所能对外服务。

bison提供了一个很棒的过载保护方案,其基本思想是区别有效请求和无效请求,系统只处理有效请求,不处理无效请求,不做无用功。主要特点是使用请求队列,每个请求带上时间戳。业务逻辑从队列取出请求之后,检查时间戳,若请求已经超时,则直接丢弃,或者返回一个失败应答。

James Hamilton[2]提供了“big red buttion”方法,即为单个功能或者服务器提供关闭启动按钮,当系统过载时,管理员可关闭一些非核心业务,从而保障核心业务的服务质量。

二、过载隔离

复杂的分布式系统由多个子系统组成, 一个子系统过载可能拖慢其他子系统,甚至导致整个系统不可用,因此隔离与过载保护是息息相关的。隔离有哪些常见做法?

超时。超时机制是隔离的外部服务的首要方法,可防止一个子系统阻塞相关的子系统。这听起来简单,但没遇故障的时候,往往不受重视。

防水隔板。防水隔板将船隔离成多个独立的空间,当船漏水时,水无进入其他空间,从而避免沉船事故。防水隔板设计模式的要点是对系统进行分区,为重要服务、重要客户、重要业务预留独立资源(譬如物理服务器,CPU核,线程池等),确保不受其他子系统影响。

Michael T. Nygard在一书中还提到了保险丝设计模式,其核心思想是监控外部依赖服务的调用情况,如果外部服务调用超时或者失败超过一定比率,则断开保险丝即不再调用外部服务而直接返回失败。保险丝断开状态会持续一段时间,超时之后才重新允许调用外部服务,此时若发现外部服务可用,则合上保险丝,恢复到原始状态。否则保险丝一直保持断开状态。保险丝模式的主要好处是:

1) 快速失败,当系统依赖的外部服务过载时,不必每次等到超时,不至于拖慢整个系统。

2)保护了外部服务。外部服务过载时,系统停止发送更多请求,降低了负载,给外部服务更多喘息机会。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
大学生就业服务平台管理系统按照操作主体分为管理员和用户。管理员的功能包括学生档案管理、字典管理、试卷管理、试卷选题管理、试题表管理、考试记录表管理、答题详情表管理、错题表管理、法律法规管理、法律法规收藏管理、法律法规留言管理、就业分析管理、论坛管理、企业管理、简历管理、老师管理、简历投递管理、新闻资讯管理、新闻资讯收藏管理、新闻资讯留言管理、学生信息管理、宣传管理、学生管理、职位招聘管理、职位收藏管理、招聘咨询管理、管理员管理。用户的功能等。该系统采用了Mysql数据库,Java语言,Spring Boot框架等技术进行编程实现。 大学生就业服务平台管理系统可以提高大学生就业服务平台信息管理问题的解决效率,优化大学生就业服务平台信息处理流程,保证大学生就业服务平台信息数据的安全,它是一个非常可靠,非常安全的应用程序。 管理员权限操作的功能包括管理新闻信息,管理大学生就业服务平台信息,包括考试管理,培训管理,投递管理,薪资管理等,可以管理新闻信息。 考试管理界面,管理员在考试管理界面中可以对界面中显示,可以对考试信息的考试状态进行查看,可以添加新的考试信息等。投递管理界面,管理员在投递管理界面中查看投递种类信息,投递描述信息,新增投递信息等。新闻信息管理界面,管理员在新闻信息管理界面中新增新闻信息,可以删除新闻信息。新闻信息类型管理界面,管理员在新闻信息类型管理界面查看新闻信息的工作状态,可以对新闻信息的数据进行导出,可以添加新新闻信息的信息,可以编辑新闻信息信息,删除新闻信息信息。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值