软件开发团队关于软件架构或技术栈的决策,很多并不是基于扎实的研究和对期望效果的认真思考,而是不准确的意见、社交媒体的信息,或者就些是“热门”玩意。这种做派的危害我见过不少,称它为“热闹驱动开发(Hype Driven Development,HDD)”。我赞成的是更专业的做法,称之为“脚踏实地的软件工程”。下面一起看看HDD的来龙去脉,想想我们能怎么改进。
新技术带来新希望
团队把最新最热的技术应用到项目里,这样的景象你见过吗?有人是因为读到了相关的博客,有人是看到Twitter上的潮流,还有人是刚刚在技术大会上听到了关于某门技术的精彩演讲。不久,团队就开始采用这种亮眼的新技术(或者软件架构设计范式),结果他们并不能更快(就像之前说的那样)开发出更优秀的产品,反而身陷囹圄。开发的速度降下来了,信心受挫了,后续版本的交付也出问题了。有些团队甚至干脆专心修bug,而不是开发新功能。他们“只需要多花几天”就能把事情搞定。
热闹驱动开发
热闹驱动开发有很多流派,也有很多渠道介入大家的项目:
Reddit驱动开发——在选择技术、架构、设计时,团队和个人的决策依据是知名博主的文章,或者reddit, hackernews, blogs, twitter, facebook, Github或者其它社交媒体上的热点。
技术会议驱动开发——仔细观察观察,参会回来的家伙们有什么表现。他们备受演讲的鼓舞。这是双刃剑。他们没有足够的研究,就开始使用最新最热的类库/框架/架构范式,而这可能是通往地狱的高速公路。
嗓门驱动开发——有人整天谈论新框架/类库/技术,他自己却没有经验,但是反复念经终于让团队决定采纳它。
Gem/类库/插件驱动开发——在RoR社区里特别流行这种情况,有时候我会发现一个gemfile太长,只有程序启动时的装载时间比它更长。这种流派源自下面的观念:Rails里的每个问题都应当有个gem来解决。有时候只要自己动手写几行代码就能解决,但是我们还是一个劲地添加类库/插件/gem/框架。
我还希望提到热闹驱动开发的一个常见流派,StackOverflow 驱动开发——开发人员从StackOverflow(总之就是互联网上)拷贝代码,而没有真正弄懂它们。
HDD就是开发团队自掘坟墓
凑热闹的问题是:它很容易导致错误决策。无论是糟糕的架构决策,还是糟糕的技术栈决策,给团队的影响都常常持续数月甚至数年。最糟的是它们会造成软件工程上千疮百孔的局面,只能推倒重来。但推倒重来几乎没有成功案例。
一切罪恶的根源似乎都是社交媒体——新观点传播得太快,还没来得及经过检验。大家还来不及细想有哪些利弊,就已经传播开去。
凑热闹的来龙去脉
大多数凑热闹的步骤是相同的,像下面这样:
第一步:真实问题和解决方案
这些热闹源自于某些真的遇到了问题的公司。公司里的团队认为,现成的技术栈、流程、架构并不能解决这个问题,必须自己动手。所以公司研发了新的框架、类库、范式,问题迅速解决了。
第二步:宣示、推广、包装关键词
团队热衷于向他人展示自己的成果。很快他们就发布了博客,也去会议上演讲。这些问题通常是有分量的,所以解决方案也是有分量的,结果也是很可观的,团队对此很自豪。其它人也开始为这项新技术而激动。唯一的问题是,并非所有激动的人都能彻底理解问题和解决方案的细节。毕竟,问题是有分量的,解决方案也是有分量的,所以不是一条推文、一次碎碎念、甚至是一篇博客就能讲清楚的。利用博客文章、技术大会的主题演讲之类的社交工具,原始信息就很容易产生偏差。
第三步:狂热现身
HDD阴影下的开发人员都会阅读博客、参加技术会议。然后世界各地的团队都开始使用新技术了。因为信息眼睛走样了,所以有些人会在框架问题上做草率的决定,即便框架没有解决任何具体问题。但是,团队仍然期望新的框架会带来帮助。
第四步:心灰意冷
新鲜劲头过去了,新技术并没有给团队带来期望的改进,反而增加了很多额外的工作。大家得重写很多代码,花不少时间专门学习。工作的速度慢下来,管理者也没耐心了。大家都感觉被骗了。
第五步:反省领悟
最终团队做了复盘,认清了为新技术付出的代价,也认清了新技术适合解决的问题。大家都变聪明了,直到追逐下一次热闹为止。
HDD举例
来看看几个热闹驱动开发的例子,看看它是怎么发生的。
举例 1:React.js
-
Facebook遇到了一个问题,Facebook自己的复杂单页面app里,会出现各种状态改变的事件,必须追踪到发生了什么,并且保持状态的连贯一致。
-
Facebook用几个时髦的词包装新范式:函数式、虚拟DOM,组件。
-
狂人说:Facebook创造了未来的前端框架。我们现在就把一切用react重写吧。
-
等等!要做的工作很多,但这项投资看不到什么短期回报。
-
React非常适用于包含很多实时通知的复杂单页面应用程序,但是对简单应用来说,它不见得合适。
举例 2:TDD被DHH杀死了
-
David Heinemeier Hansson(DHH,Ruby on Rails框架的创造者)意识到,Rails的框架里没有对OOP支持很好的架构,所以很难做测试驱动开发。于是他做了个现实的选择:不要提前写测试代码。
-
DHH的博客和会议演讲引发了热闹。关键词:TDD is DEAD。
-
忘了测试吧!我们的领袖说过。一个测试也不要写。我们可不是在假装,而是虔诚地执行。
-
等等!以前一些能正常运行的代码现在都出问题了。我们正在写的代码错误百出。
-
TDD无所谓生死。TDD是需要权衡的对象,权衡因素包括API变化的风险、既有设计、参与者的水平——Kent Beck。
举例3:微服务
-
巨大的单体系统很难扩展。在某个时候我们可以把它拆成多个服务。如果用QPS之类的指标来衡量,扩展就容易很多,也更容易拆散到多个团队。
-
热闹关键词:可伸缩性、松耦合、单体系统。
-
让我们重写所有的服务!我们的单体系统都成了一碗“意大利面条”了。得把所有东西都拆成微服务。
-
见鬼!现在系统开发的速度变慢了,部署的难度提高了,我们还花了不少时间在多个系统之间追踪bug。
-
微服务需要团队有充分的DevOps能力,还需要权衡增加系统和团队扩展性,保证投入划算。在你遇到严重的规模问题之前,这样的投资是超前的。微服务是提炼出来的,不是重写出来的。按照Martin Folwer的说法,微服务的门槛可不低。
举例 4:NoSQL
-
在应对高压力和处理非结构化数据时,SQL数据库有不少问题。全世界的团队都在研究新一代数据库。
-
热闹关键词:可伸缩性、大数据、高性能
-
我们的数据库太慢,而且容量不够。我们需要NoSQL。
-
我们还需要联表查询?这可不行。简单的SQL操作现在都越来越有挑战了。开发速度越来越慢,我们的核心问题还没解决。
-
NoSQL是用来解决特定问题的(要么是海量的非结构化数据,或者非常高的负载)。如果水平足够高,关系数据库也是应对高负载和处理海量数据的好工具。一定需要NoSQL的情况,在2016年仍然不多见。
举例 5:Elixir和Phoenix (或者是你喜欢的语言/框架组合)
-
RoR之类的Web框架不能很好地应付高性能应用、分布式应用、Websockets。
-
热闹关键词:可伸缩性、高性能、分布式、容错性。
-
噢,我们的系统太慢,我们的聊天系统不是可伸缩的。
-
才发现,学习函数式编程和分布式解决方案没那么容易,我们进展真慢。
-
Elixir和Phoenix是很优秀的框架,但学习成本太高。如果你确实需要高性能的系统,它的益处要很长时间才会显现。
推而广之
在软件开发的小小天地里,已经有太多领域是热闹非凡的了。在JavaScript里,几乎每天都有新框架诞生。Node.js(关键词:事件编程),React编程,Meteor.js(关键词:共享状态),前端MVC,React.js…… 你可以随便举例。软件工程领域里新架构也在诞生:领域驱动开发,六边形架构理论,DCI架构(数据-场景-交互)。哪种你最喜欢?
正面的例子
如果我们不能相信网上的言论或是其他人的说法,那如何做出聪明的选择?下面是一些好的建议:
先测试、研究,再决定
快速搭建原型,不要从博客学习,而要从经验学习。针对新技术提供的功能,在决定采用之前花一两天搭个原型,然后组织团队分析利弊。你可能会遇到若干能彼此替代的技术,可以让团队里不同人用不同的技术搭原型。
黑客马拉松,这也是不错的办法,它让大家真正领悟不同技术的代价几何。让整个团队花一两天来把玩所有兼具风险和诱惑力的技术。这会让大家自主做出聪明的选择,根据自己的经验来决策。
何时开始?
原则上说,应当选择投资回报巨大的时间点开始。大多数技术是用来解决特定问题的。你遇到了那个问题吗?那个问题重要不重要?会不会节省很多时间?新技术带来的好处能不能抵消学习成本和重新的成本?如果我们一开始就把开发速度降到1/2甚至1/4?这样还值得吗?
伟大的团队有更多自主权——一些团队只是能比其他团队更快创造价值。他们更容易厌烦自己手头的工作。这些团队可以更频繁地引入新技术。但这不是省略快速搭建原型或者黑客马拉松的理由。相反,如果这样的团队在交付上遇到了麻烦,一定要加倍小心。
雇佣对的人
有良好技术背景的人——那些人了解不同的范式,理解编程的理论(算法和并发),受过良好工程文化熏陶,这样的人很少去凑热闹。
有经验的人——年轻的开发人员更喜欢凑热闹。如果有多年的开发经验,见过许多技术,踩过许多坑,在选取技术时就更容易做出客观的判断。