“大规模OpenStack”的新一集讨论运营商的技巧和工具。在现场讨论中,嘉宾将展示他们使用的技巧和自制工具,以保持OpenStack集群的良好运转。欧洲核子研究中心的云架构师Belmiro Moreira支持了这次讨论。
Infomaniak(OpenInfra基金会白银成员)
Infomaniak的云管理员Axel Jacquet和Thomas Goirand以OpenStack的使用和现场演示的一些背景知识介绍了一系列工具和技巧。
Infomaniak从Grizzly开始就一直在使用OpenStack。它是一家瑞士公司,在瑞士有两个数据中心,第三个数据中心不久将上线。几个月前,他们开通了一个公共云,提供基本的OpenStack服务,包括Glance、Keynote、Nova、Cinder、Neutrono等。Magma、Assign和马尼拉都在其路线图上。
他们介绍了两种工具来解决两个常见的基础设施管理问题:HA虚拟路由器故障切换和实例连接检查。
OVH(OpenInfra基金会白银成员)
OVH Cloud的站点可靠性工程师Adrien Pensart分享了OVH的OpenStack公共云是如何由20个区域组成的,挑战之一是管理所有不同的部分。Pensart介绍了几种工具,这些工具有助于统一不同的工作流和基础设施组件,并演示了在需要升级主机时如何完成主机维护。
LINE
LINE的基础设施软件工程师Gene Kuo介绍了他们用来管理OpenStack集群的几种技巧:
——串行虚拟机监控程序升级:团队将虚拟机监控程序分成不同的组,并以串行方式进行升级。他们这样做是为了防止多个Neutron代理或Nova计算服务同时重新启动。这有效减少了升级期间RabbitMQ集群的负载。
——Keystone中的Retired标志:当员工离开公司时,这简化了凭证的转换,以防止生产服务中断。
——动态虚拟机监控程序禁用:定期脚本扫描虚拟机监控程序节点以确定虚拟机监控程序的负载。如果负载过高,它们会临时禁用虚拟机监控程序,以防止调度新的虚拟机,从而避免出现嘈杂的邻居问题。
Workday
Workday的DevOps工程师Shatadru Bandyopadhyay介绍了Cloudmap,这是一种在Workday跨所有数据中心向所有虚拟机提供集中报告和搜索的工具。该工具旨在提供云资源的简单可视化,足以应对大多数普通用户的查询和需求。这有助于克服由于规模大而依赖Horizon来可视化所有集群的挑战。
CERN
Moreira分享了欧洲核子研究所的一个工具。他介绍了“Cloud by Numbers”这个工具。
他还介绍了Migration Cycle,这是一种为实时迁移提供基础设施集成和编排的工具。这个工具的用例包括硬件修复、硬件退役和计算节点Linux内核升级。
原文链接:
https://superuser.openstack.org/articles/large-scale-openstack-operators-tricks-and-tools-openinfra-live-recap/