谈 DevOps 平台设计:版本号相关功能的设计

640?wx_fmt=jpeg

在设计 DevOps 平台时,笔者认为版本号的管理是一个绕不开的课题。可是,行业里似乎很少人提这个事,笔者觉得要谈一谈,所以就有了这篇文章。

一万个人的眼里有一万个“版本号”

笔者这三年在同一家公司里,换岗换了四个团队。团队的成员组成各异,有的团队都是在大型跨国企业跳槽过来的,有的团队大部人都是刚毕业的。

每到一个团队,团队运行一段时间,都会做一件事情:讨论该怎么定义这个版本号。版本号的制定,有些只有开发人员参与,有时会有产品经理参与,有时还有 PMO 参与。

经过这些讨论,我发现:一万人的眼里有一万个“版本号”。讨论的最后,基本上就是谁的嗓子大,听谁的。

所以,在讨论“版本号”之前,一定要搞清楚讨论各方对于“版本号”的理解,再深入讨论,否则,大家谈的都会是牛头不对马嘴的东西。浪费时间。

为什么对于“版本号”,各方的理解,差异会如此大。笔者认为,主要是因为他们关心的面不同。

APP产品经理关心的是该APP在用户界面上显示的版本号,比如当前爱彼迎的APP的版本号是:1.9.44.china。

对于后端开发工程师,关心的是网关服务的版本是1.2.1、客服服务的版本是4.11.1。

对于前端开发工程师,关心的是通用组件的版本是2.1.1、首页组件的版本是3.1.1。

而对于 PMO,他们可能只关心在 Staging 环境的最后一个版本是否为一个稳定的版本(这写在他们的管理规范里),保证不影响测试人员的工作,根本不关心具体的“版本号”是多少。

重新认识版本号

各方的关注点不同,不是问题,但是我们作为一个平台的设计必须对“版本号”有更深入的理解。

笔者分析各方的关注点,他们所说的“版本号”分布在以下两个层面:

  1. 技术层面:程序员关心线上跑的是哪份代码(对应的是Git\SVN中的Commit ID)、运维关心线上跑是哪个版本(对应的就是具体哪个包)。

  2. 业务层面:方便终端用户识别的版本号,产品经理也属于这一层面。

认识到这点,我们设计DevOps平台,就会对两种版本号进行区别对待,进而设计出对团队非常有用的功能,最终帮助团队更好的实现交付。

为方便沟通,技术层面的版本号,如 Commit ID 我们称为技术版本号,业务层面的版本号,称为业务版本号

版本号相关功能设计

但是版本号有什么用?仔细想想,除了产品经理发布时要定个版,后端服务的版本用于保证服务之间的相互引用或调用不出问题,就没有什么别的用处了。

也许是因为大家都不了解版本号的用处,也或者是认为它根本就不值得讨论,所以,笔者在国内的几个大的平台都没有看到版本号的相关功能的设计。唯一使用到版本号的地方就是在制品库,部署时需要指定制品的版本号。而业务版本号与技术号之间的关系被隐藏得很深,用户很难查到。

笔者不想一开始就谈它的好处。我直接上功能,下图是笔者臆想出来的。

640?wx_fmt=png

笔者认为,DevOps 平台应该有的功能之一:能输出这么一幅图,暂定名为版本关系图。图中的方块下,同时标有业务版本号和技术版本号。而图中的系统之间的连接线是应用系统的调用链,读者可忽略。

版本关系图应该能提供以下信息:

  1. 系统应用之间的版本依赖。

  2. 系统内部所依赖的组件的版本。

  3. 能根据某系统的版本查到目前直接依赖于或间接依赖于它的其他系统。

  4. 各系统的版本变迁信息。

这些信息能给用户带来的价值如下:

  1. 团队内信息更透明,沟通效率更高,可以有效避免某个员工成为单点。你不必等其他成员,自己也可以得到整个系统的版本信息。

  2. 可以提高团队成员的排错能力,因为当A发布新版本后,APP 首页打开变慢,有了版本关系,我们可以首根据整个平台的“版本事件”来排查问题。同时,团队也很快可以找到相应的代码变更,然后进行 review 及修复。

  3. 上图中,当 A 服务是一个集群时,我们还可以将部署的目标机器与版本号关联起来了。这样,团队就可以轻松的知道,哪台机器部署了哪个版本。

上图只是整个业务系统的某个时间点的“快照”。事实上,我们还可以在版本号上做更大的文章。比如让技术版本号与代码质量、构建速度等过程指标关联起来,这样我们可以在不同的版本之间进行对比。再比如计算两个业务版本号之间,代码质量的差异,长期积累下来这些数据后,我们就有能力计算出代码质量与业务指标之间的关系。

总的来说,版本号就是整个研发流程中的各项指标数据的枢纽。

后记

版本号和其它数据的关系的价值,笔者认为被大大低估了。希望本文能给 DevOps 平台设计者带来不一样的想法。

640?wx_fmt=png

图片地址:https://pixabay.com/zh/photos/road-drone-aerial-trip-travel-4564817/
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
刚刚发布的ThoughtWorks技术雷达 建议技术团队“暂缓或谨慎”使用反模式“CI theatre(伪CI,可以理解为不完整的持续集成)”。 “伪CI”描述的是实践持续集成(CI)过程中的一些错觉,然而这些并不是真正的CI实践。 基于持续集成,我和同事 Emily Luke做了一些研究, 我将分享伪CI是什么样的,为什么我们建议你“暂缓或谨慎使用”,以及预防伪CI的方法。持续集成我最喜欢的CI定义来自于continuousdelivery.comCI开发人员定期(至少每天)将他们所有的工作集成到主干(也称为主线或主干分支)这个引用中暗含了CI实践的两个基本原则。第一个是“把他们所有的工作集成到主干”;第二个是“至少每天”。对于CI还有一系列其他原则和实践,例如:将所有内容都检入您的代码库,构建每个提交,自动化构建,保持快速构建,并有可以自我验证的代码, 还有Martin Fowler 关于持续集成的评论中的可视化故障并立即修复故障等。我个人认为 每天至少检入代码到主干分支一次 是CI的基础。没有达到这一点就只是伪CI而不是真正意义上的CI。伪CI是什么样的?这是我们调研到的一个故事,一位经验丰富的开发人员(让我们称他为David)来自湾区的一个中型创业公司,每周有两次产品交付。 David说他的组织正在践行CI,他说:“是的,我们用Circle CI”,他描述了一个具有挑战性的场景,曾经在一个分支上工作了一段时间,大约修改了100个文件和7000行代码,然后在代码审查阶段就开始招架不住了,因为他要向他的同事解释所有的代码变更的原因。“最具挑战性的事情是你最终要将一大堆功能集中到一个提交里,因为它们都是这个组件的一部分”,他解释说:“我希望有一个更好的方式来分解这些提交,因为很难把所有事情(变更历史)记在脑子里。”如果这个情况你听起来很熟悉,那么你也在做伪CI。 如果有下面的这些场景,那么你们就是在做伪CI:当有人问起你们在实践CI吗? 如果你说我们有一个CI服务器并且我们使用X工具在我们的调查中,只有10%的参与者承认有CI服务器与CI践行不一样。 相反,90%的个人表示他们正在践行CI,无论他们是否有专门从事CI的基础知识。 所以简单的认为只要有一个CI服务器就是“在做CI”,这就清楚地表明是在做“伪CI”。使用长期开发分支,但不会定期检入master主干在David的故事中,他们并没有实践每天检入master主干,这就是“伪CI”的标志。 这是我们在调研中常看到的一种模式,其中团队在master主干上运行CI,但不频繁构建,也不是每天都在提交。 或者他们在分支上运行CI,但不会频繁的集成到master主干。 只对特性分支运行CI,其实应该称之为持续隔离(continuous isolation)才对.合并分支时感到焦虑和疲惫真正的持续集成要把代码所有者的责任意识扩展到整个团队。 这改变了团队内部人员的观点以及他们对失败构建的态度。 不再是“我的宝贵的分支”,或是“我的错误导致构建被破坏”,而是“我们的代码”和“我们的失败”。David遇到焦虑和疲惫的事实清楚地表明,他忽略了CI的一个重要的优势:持续反馈和代码集体所有权。伪CI还有更多的一些现象,虽然我们发现有一些并不那么常见,但它们仍然存在一些问题,构建的时候,仅有极少的测试覆盖允许构建长时间处于失败状态虽然David的团队引入了一个备受尊崇的CI工具和常见的流程,如特征分支和代码审查,但他们并没有实施全套CI实践,因此错过了许多好处。 我们遗憾的发现,在我们的研究的组织中90%发生了这种情况。一些组织实施伪CI中反而错失了CI的主要优势 - 快速反馈,代码集体所有权,并准备达成持续交付如何避免,预防和解决伪CI的问题?如果您确定可能正在遭受伪CI之苦,则可以通过三种方式来解决问题并进行持续改变。1. 提交更频繁回到根本,尽量频繁地提交,每天至少提交一次应该是最低目标。 如果你还没有开始做CI,这就是你可以开始的地方,即使你在做CI,依然会有改进的空间。我喜欢“频率降低难度”的说法。 往往我们在做一些事情时,任务变得越小,则其更容易被实现。 持续集成就是是一个典型例子。 我的建议是要更加频繁地检入你的代码到代码库并且将开发分支集成到主干分支,至少每天集成一次”。2. 基于主干分支开发有很多论坛在讨论基于主干还是基于开发分支进行开发,我不想讨论那些血淋淋的细节。 然而,在我们的调研中,当我们与一些曾经在实践CI过程中感到痛苦的人交时,没有引入主干开发的团队对此有更深刻的感受。 DevOps现状调查报告-2016 还发现,基于主干开发和持续集成是达成持续交付的关键因素,同时也能建设更高效能的团队。基于主干的开发肯定会有一定的挑战,但它可以把问题提前暴露出来,而不是要等到代码合并、代码审查甚至到延迟发布的时候。如果你想达到更好效果的CI和CD,我建议在主干上做开发,或者如果你更愿意使用短周期的临时分支(合并到主干之前不到一天)进行开发,那么最好同时不要超过三个以上的活跃分支。3. 自动化自动化是做好持续集成的基石,所以如果你还没有自动化一切,现在是开始的好时机。 如果你认为已经实现了所有自动化的功能,那么每次有人手动地做任何事情超过一次,便要问自己“这个为什么不能自动化”? 我已经观察到自动化不仅可以帮助您在CI中变得更好,还可以帮助您开始持续交付。总结现在你知道什么是伪CI了,如果你的团队正在这么实践伪CI,那么你可以阻止这种情况继续发生了。 如果您仍然感到困惑,我建议你在Martin Fowler的博客“CI Certification test”做一个测试, 以确认你的组织是否正在做可靠的CI。 如果你通过了CI测试,那太好了,现在是考虑您是否准备好实施持续交付的时候了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值