Freewheel与亚马逊云科技紧密合作,共同应对云上运维挑战

关键字: [亚马逊云科技中国峰会2024, FreeWheel, 云原生运维工具, 运维体系架构, 全球广告交易平台, 视频媒体广告服务, 大型赛事广告投放, 基础设施代码管理, 权限管控策略, 生产变更自动化, 镜像管理服务, 系统架构弹性]

本文字数: 1600, 阅读完需: 8 分钟

导读

在亚马逊云科技中国峰会2024上,FreeWheel全球Ops团队Director刘显分享了云原生时代FreeWheel在构建云原生运维工具和运维体系、运维架构方面的实践。他阐述了FreeWheel作为全球知名的数字广告公司,在应对全球重大赛事流量峰值和不可预测性的挑战时,如何利用亚马逊云科技服务实现基础设施资源的标准化、自动化和灵活性,通过Infrastructure as Code和Policy as Code的理念管理基础设施和权限,实现高度自动化的生产变更流程,以及构建Golden Image as a Service系统统一管理操作系统镜像,从而提高运维效率,加强安全合规性,增强系统的弹性和可靠性。

演讲精华

以下是小编为您整理的本次演讲的精华,共1300字,阅读时间大约是6分钟。

这是一场亚马逊云科技中国峰会的直播,由亚马逊云科技高级客户解决方案经理陈赫主持,邀请了Freewheel全球OPS团队Director刘显作为嘉宾。

陈赫首先介绍了Freewheel是一家全球知名的数字化广告公司,长期是亚马逊云科技的客户,经历了从传统架构到云原生架构的迁移和演进。他请刘显简单介绍一下Freewheel公司的背景和业务特点。

刘显表示,Freewheel是美国康卡斯特公司旗下的一家公司,专门为视频媒体、广告主以及媒体买家提供高端的全面的广告交易平台。依托优质视频内容、可靠数据分析和先进技术,能让买家和卖家更容易在各种屏幕和销售渠道上进行交易。

陈赫说,作为Freewheel的客户经理,他见证了Freewheel在云上的发展历程,并深入使用了亚马逊云科技的多项服务。Freewheel为奥运会、世界杯、超级碗等全球重大赛事提供关键广告服务,需要应对流量峰值、不可预测性和对全球架构稳定性的超高要求,遇到了不少挑战。他请刘显分享一下Freewheel在这方面的经验。

刘显表示,在支持顶级赛事实时广告投放服务时,从团队保障、容量管控、扩容策略、监控报警、故障处理到成本管控等方面都面临巨大挑战。他分享了几个具体应用场景:

  1. 容量管理
  • 对于大量不可精确预测的实时广告请求和流量,Freewheel对容量管理提出了很高要求。他们会与客户紧密沟通,获取广告播放时间段、持续时长、并发用户数、峰值流量等关键预测数据。结合自身经验和流量模型,进行多轮应用模拟压测,找出系统弱点和资源需求瓶颈。然后与亚马逊云科技团队分享信息,审查每个区域的资源可用性,利用资源预留和预热服务,预留足够资源做好准备。
  1. 成本管控
  • 为保障服务质量和稳定性,Freewheel会预留一定资源buffer,但也意味着一定程度的资源浪费和额外成本。他们会基于平时流量数据计算单位成本模型,结合赛事期间成本变化和预留服务成本,反推相对精确的资源需求,为下次赛事做出精确的成本管控。

陈赫补充说,支持全球重大赛事是一项系统工程,亚马逊云科技的客户团队和后台知识团队为此做出了很多努力。他知道Freewheel在工具建设方面做了很多尝试,如EC2 Benchmark测试工具、镜像管理工具等,并有一套覆盖云资源管理的云原生运维管理平台,请刘显介绍一下这方面的成就。

刘显表示,为提高运维效率、避免生产事故,Freewheel从上云第一天开始就着手内部运维工具建设,目前已比较成熟,称为FOC(Freewheel Ops Center)。它集中了访问控制、资源管理、配置变更、数据访问、成本管理等多种功能,不仅面向运维团队,也面向开发和售后服务团队,提供了丰富的API接口以支持自动化。他分享了几个重要的使用场景:

  1. 可观测性
  • 结合亚马逊云科技的服务,FOC可直观展示不同区域的资源使用情况;内嵌自身服务指标和趋势图,全面掌控服务运行状态;生成云治理审计报告,包括权限、标签覆盖率、标准镜像覆盖率等。
  1. 基础设施CI/CD
  • 践行基础设施即代码理念,通过代码管理全局资源如IAM、VPC、S3、EC2等,实现跨团队跨环境的一致性部署,提高效率。设计流水线时遵循最小权限原则,内置安全合规政策。
  1. 生产变更
  • 对生产环境的各种变更需求,FOC实现了90%以上的自动化流程,包括发起、审批、结果校验、审计等,再加上少量人工辅助,可快速安全地完成变更部署。
  1. 镜像管理
  • 依托亚马逊云科技的服务,构建了自服务系统GoldenImageAsAService,让各团队可从源头统一控制操作系统镜像的创建、分发,并内嵌了安全合规政策,实现跨账户跨区域的统一安全部署。

接下来刘显分享了Freewheel在系统弹性(Resilience)建设方面的工作:

  1. FMEA研讨会
  • 采用这种方法论,系统化地识别系统风险点和弱势,推动制定短中长期改进计划。
  1. 工作负载审查
  • 深入学习亚马逊云科技的工作负载审查实践,从工作负载定义、架构设计、监控部署、故障处理、安全合规等全方位对系统进行审查和评估。
  1. 混沌工程
  • 依托亚马逊云科技的混沌工程工具和服务,针对不同服务开启混沌工程实践,系统提升系统在各层面的弹性和服务质量。

最后,刘显重点介绍了Freewheel在成本管控方面的一个关键实践——服务树(TagTree)。这是一个轻量级但关键的基础服务,类似CMDB,支撑了云资源架构、命名一致性、安全合规和隔离等基础工作。它采用三层树状结构,根据公司结构和产品命名定义项目层,下面是子系统/应用层,最下层是细粒度服务集群。通过唯一的组合标识,可以精准标记每个生产资源和服务,从多维度筛选服务费用明细,识别资源浪费,并提供预算报警通知。

陈赫总结道,非常感谢刘显的分享,亚马逊云科技的客户团队将继续支持Freewheel,共同创新。他也感谢网友的收看,并邀请继续关注亚马逊云科技中国峰会的后续精彩内容。

总结: 这场直播分享了Freewheel作为亚马逊云科技长期客户在云原生架构迁移中的实践经验,重点包括:容量管理、成本管控、运维工具平台建设、系统弹性能力提升等方面的具体做法和工具应用,展现了Freewheel与亚马逊云科技的紧密合作,共同应对云上运维的各种挑战。

下面是一些演讲现场的精彩瞬间:

刘显先生,来自FreeWheel公司全球运维团队,在亚马逊云科技中国峰会2024上致欢迎辞。

2ab90e533c5fe1baecdbaf2925a5f3b4.jpeg

陈赫欢迎大家来到亚马逊云科技中国峰会直播间,并介绍了 FreeWheel 全球 Ops 团队 Director 刘显作为嘉宾分享云原生时代的运维实践。

5dcb183e92d2c48ae31c41a783ff373e.jpeg

亚马逊云科技中国峰会2024上,演讲者介绍了亚马逊云科技长期合作伙伴FreeWheel公司的背景及其从传统架构向云原生架构迁移的经历。

e5a9f837941125edd1e32593ab0df7e1.jpeg

FreeWheel 作为亚马逊云科技的重要合作伙伴,为全球重大赛事提供关键广告服务

亚马逊云科技中国峰会2024:通过在资源部署流水线中嵌入权限管控政策和安全合规开发规范,实现了”Policy as Code”的理念,确保了基础设施的安全合规性。

2d2cca5dd8b897c60c851a91c39f42a9.jpeg

通过自服务系统”Golden Image as a Service”,实现了操作系统镜像的统一创建和生命周期管理,并嵌入了安全合规性要求,从而在操作系统层面实现了跨账号、跨区域的统一安全部署。

c0b710777b5adf52c89c4975551075b0.jpeg

总结

亚马逊云科技中国峰会2024上,FreeWheel全球Ops团队Director刘显分享了云原生时代FreeWheel在构建运维工具和体系的实践经验。作为全球知名的数字广告公司,FreeWheel依托亚马逊云科技服务,为重大赛事提供关键广告服务,应对流量峰值和不可预测性的挑战。

首先,FreeWheel通过Infrastructure as Code和Policy as Code的理念,实现了基础设施资源的标准化、自动化和灵活性。他们利用IAM Role、Security Group、S3和EC2等全局服务,通过代码管理和一致部署,提高了执行效率并降低了定位成本。同时,他们在CI/CD流水线中嵌入了安全合规政策,实现了权限管控。

其次,FreeWheel优化了生产变更流程,实现了90%以上的自动化,确保快速安全地部署变更。此外,他们构建了Golden Image as a Service系统,依托EC2 Image Builder服务,实现了操作系统镜像的统一管理和安全合规性。

最后,FreeWheel重视系统架构和服务的弹性,期望基础设施和服务能够具备恢复能力,以应对各种挑战。通过这些实践,FreeWheel在云原生时代构建了高效、安全、弹性的运维工具和体系。

2024年5月29日,亚马逊云科技中国峰会在上海召开。峰会期间,亚马逊全球副总裁、亚马逊云科技大中华区总裁储瑞松全面阐述了亚马逊云科技如何利用在算力、模型、以及应用层面丰富的产品和服务,成为企业构建和应用生成式 AI 的首选。此外,活动还详细介绍了亚马逊云科技秉承客户至尚的原则,通过与本地合作伙伴一起支持行业客户数字化转型和创新,提供安全、稳定、可信赖的服务,以及持续深耕本地、链接全球,助力客户在中国和全球化发展的道路上取得成功。

  • 22
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值