架构设计
文章平均质量分 88
运维个西瓜
这个作者很懒,什么都没留下…
展开
-
设计和部署互联网级别的可扩展服务--On Designing and Deploying Internet-Scale Services
On Designing and DeployingInternet-Scale ServicesJames Hamilton– 2007.12本文总结了用于设计和开发运维友好的服务的一系列最佳实践。以下为三条基本原则,这三条原则形成了贯穿后面大多数讨论的主线。Expect failuresKeep things simpleAutomate every翻译 2016-09-29 01:10:13 · 874 阅读 · 0 评论 -
系统架构设计方法论——IBM架构解决方案设计
IBM内部有一套自成体系的架构设计方法论,且是和TOGAF所互相承认效力的。相比较而言,IBM的架构设计理论,在实际上的可操作性会更强,也可以说是功利性更强些。当然,也会更容易落地使用。该理论包括5个架构设计的步骤:1、理解客户的业务和需要(Understand Client's Bussiness and Needs)具体的理解范围包括:客户的业务发展方向,Business原创 2017-08-27 15:50:25 · 6352 阅读 · 0 评论 -
系统架构设计方法论——TOGAF
1、ADM的架构开发阶段ADM方法是由一组按照架构领域的架构开发顺序而排列成一个环的多个阶段所构成。通过这些开发阶段的工作,设计师可以确认是否已经对复杂的业务需求进行了足够全面的讨论。TOGAF中最为著名的一个ADM基础结构图如下所示:ADM方法被迭代式的应用在架构开发的整个过程中、阶段之间和每个阶段内部。在ADM的全生命周期中,每个阶段都需要根据原始业务需求对设计原创 2017-08-27 15:49:35 · 42018 阅读 · 1 评论 -
系统架构设计方法论——Zachman
Zachman框架模型分两个维度:横向维度采用6W(what、how、where、who、when、why)进行组织,纵向维度反映了IT架构层次,从上到下(Top-Down),分别为范围模型、企业模型、系统模型、技术模型、详细模型、功能模型。横向结合6W,Zachman框架分别由数据、功能、网络、人员、时间、动机分别对应回答What、How、Where、Who、When与Why这六个问题。原创 2017-08-27 15:48:19 · 3848 阅读 · 0 评论 -
ITIL 2011 服务管理与认证读书笔记——第六、七章【服务运营、持续服务改进】
一、服务运营服务运营讲的是如何通过有效的工具、技术和既定的流程实施服务和运维管理,来为客户创造价值和收益。为提高服务运营人员的工作效率和标准化日常操作,职能组织应采用和维护标准操作手册(Standard Operating Procedures, SOP).1、基础知识目的服务运营,Service Operation,是按照同客户签订的SLAs协议,对终端用户实施服务,原创 2017-08-14 00:48:39 · 3096 阅读 · 0 评论 -
自动化的DNS域名解析切换功能在网站服务高可用设计中的实践
一、使用DNS域名解析做网站服务高可用的初衷DNS域名解析大概是最早应用在服务高可用领域的一种负载均衡技术。早期往往需要自行建设和维护DNS Server,还需要保障DNS服务本身的高可用。近年来发展起来一批专门提供DNS解析服务的厂商,不但提供免费、付费解析服务,而且会提供API供客户进行集成开发。以DNSPOD为例,最低收费的套餐应该是企业创业版套餐,大约年收费一千多块钱,以上功能均可以使原创 2017-07-22 19:09:30 · 6514 阅读 · 0 评论 -
SRE Google 运维解密 具体实践二
十四、管理关键状态:利用分布式共识来提高可靠性跨物理区域分布式运行系统可以解决很多的系统灾备问题,以保障在灾难来临时系统仍然能正常运行。但是却带来维护系统一致状态视图的需求,而这个问题的解决常常是复杂且难以实现的。一组服务进程可能想要可靠地对以下问题产生共识:哪个进程目前是该组织进行的leader?本组中都包含哪些进程?是否已经将某个消息成功地插入了某个分布式队列?某个进程目前是否原创 2017-06-08 01:32:16 · 2980 阅读 · 0 评论 -
SRE Google 运维解密--管理
一、迅速培养SRE加入on-call在SRE团队的职责中,主动性任务和被动性任务兼有,每个SRE团队都坚守的一个重要目标是:利用积极主动的办法,去减少和限制被动性工作的产生。SRE培训课程推荐的培训方式错误的培训方式设计一个具体的、有延续性的学习体验,以便学员跟进通过给学员安排一些烦琐的工作(处理警报/工单)来培训原创 2017-06-15 22:40:38 · 6617 阅读 · 0 评论 -
WEB应用发布管理平台的设计与实现
一、设计的初衷应用发布上线、版本回退以及配置管理是每个运维人员都要面对的工作内容,有时候甚至还会占用非常多的精力。当然最大的问题不在于浪费些我们运维人员的时间,而是完全依赖手工维护的应用,因为人为操作失误带来的技术故障的例子实在是太多了。降低故障率,提高工作效率都是运维工作中特别突出的痛点。这也是我思考、设计和实现一个WEB应用发布管理平台的初衷。一定会原创 2017-05-17 01:18:55 · 3760 阅读 · 2 评论 -
SRE Google 运维解密 具体实践一
一、基于时间序列数据进行有效报警Borgmon是google使用的时间序列监控系统,在开源软件中Prometheus是非常类似的一款工具。这个软件将收集时间序列信息作为监控系统的首要任务,同时发展了一种丰富的时间序列信息操作语言,通过使用该语言将数据转化为图表和报警。因为总是会有大批量的服务器在上线、下线,建立和维护一个有效的服务注册、发现系统是很有必要的。上线的主机需要能主动让B原创 2017-05-24 10:07:10 · 6481 阅读 · 0 评论 -
几种磁盘读写性能相关的服务器磁盘使用策略与压测方法
1、关于磁盘RAID在以往工作中因为各种缘由,也使用过多种的磁盘高可用配置策略。谈磁盘高可用,大多数时候就是在谈数据冗余保护配置RAID。但当和实际业务结合起来时,保障业务应用的读写性能需求才是第一位重要的,有时不得不要略牺牲一些磁盘高可用设计。众所周知的,常用RAID级别有0,1,5,6 。RAID0,只做条带化,直接把数据切分成多段,然后分别写入到多个磁盘中去。因此RAID0具有所原创 2017-04-10 12:00:29 · 5534 阅读 · 1 评论 -
一种兼顾成本与性能的应用高可用部署架构
在实际的生产环境应用部署中经常遇到的问题是性能和服务的高可用。而成本支出又让前面的问题在解决起来阻力重重。本文就是根据实际工作经验总结和设计的一种兼顾成本、性能和服务高可用的应用部署架构。1、本高可用部署架构使用的资源共计4台设备,以下仅供参考:PC服务器:2*cpu, 8*16GB内存,8*600GB 10k磁盘,iDRAC企业版,双电,品牌:DELL,型号:R630原创 2016-12-12 08:59:39 · 951 阅读 · 0 评论 -
系统可用性分析方法与设计模板
1、可用性管理任务的时间与方式服务或组件的可用性和不可用性,及其度量方法2、可用性管理的被动活动:调查服务与组件的不可用性并探究修复活动(事件、故障、问题)监视、测量、分析、报告和审查组件和服务可用性的各个方面3、可用性管理的主动活动:事先规划、设计和提高可用性。规划并设计全新或变更的服务评估与管理风险实施成本合理的应对措施,如降低风险与增加恢复机制持续原创 2017-09-29 23:41:49 · 2375 阅读 · 0 评论