-
google使用 Borg(伯格)分布式集群管理系统进行资源分配,负责集群层面管理任务的编排工作;
-
google使用 BNS 在Borg启动某一个任务时,会给每个具体的任务实例分配一个名字和编号,作为名称解析、地址转换;
-
google数据中心构建拓扑结构:
Rack Row Cluster Datacenter Campus 数台物理服务器组成机柜 数台机柜组成机柜排 数排机柜组成一个集群 多个集群组成数据中心 多个相邻的数据中心组成园区
-
google使用 Jupiter 虚拟及网络交换机服务为数据中心内服务器提供网络通信;
-
google基于SDN网络技术构建 B4 全球数据中心骨干网络,可管理海量流量、动态优化网络连接,采用普通的非智能交换组件结合集中化的控制器连接方式将整个集群复杂路由计算从具体交换硬件上分离;
-
带宽控制器 BwE 负责管理所有可用带宽,优化带宽的目的不仅仅是节约成本,利用中心化的路由计算,解决以前在分布式路由模式下难以解决的流量迁移问题;
-
google全球负载均衡 GSLB 主要负载工作:
- 利用地址位置信息进行负载均衡DNS请求 - 在用户服务层进行负载均衡 - 在远程调用层进行负载均衡
-
google使用 Chubby 集群锁服务提供一个与文件系统类似的API用来操作锁,其可以处理异地、跨机房级别的锁请求,使用Paxos协议来提供分布式一致性,同时也是实现主实例选举过程的关键组件;
-
google使用 Borgmon 定期从监控对象抓取监控指标、监控、分析、预警、保存等等;
-
google的每个应用程序均提供一个内置的HTTP服务,提供一些调试信息和统计信息,供在线调试、监控使用;
-
所有google服务都是用远程调用通信,Stubby–开源实现gRPC;
-
Protocol Buffer(Protobuf)是google RPC的传输格式,与Apache Thrift类似,与XML相比有更简单易用、数据大小比XML格式小3~10倍、序列化和反序列化速度快100倍、协议更明确等优点;
-
google注重研发效率,但上线任何代码前都需要评审。
SRE Google运维解密-第二章
最新推荐文章于 2023-05-27 19:24:10 发布