从一个“仅为”$1Bn的开源数据库IPO,聊聊开源和infra的现在与未来

59f8879ea59de47e8b69ef40707bd1a5.gif

30497b858d1477127c2adc13b4b0427f.png

| 作者:M小姐走四方

| 转载自:M小姐研习录

| 编辑:钱英宇

| 设计:周颖

| 责编:王玥敏

前段时间开源和 infra 人被 Confluent IPO 还有一系列的 mega rounds 搞得很鸡冻(没错 Confluent 的分析我拖到现在也没写完),然而最近一个同样开源的NoSQL database,Couchbase, IPO定价才刚过$1Bn。(对比一下,竞争对手MongoDB 市值超过230亿美金!)

上市第一日(居然)上涨26%,但是在 database 这样风口正盛的大市场,仍然是不到15x PS 的估值——要知道,现在美国二级市场 SaaS 公司虽然估值回调不少,但是对增长率>30%的高增长公司 PS 也将近30x。

这样的现状,不知道会不会让大家对待开源和infra稍微冷静一些。

IPO 虽小,M小姐倒是觉得,是一个很好的契机,把 Couchbase 和更成功的竞争对手 MongoDB 做个对比,借此唠唠,什么是好的基础软件,什么是好的开源。

ce8c39ccd08aef6b3963820202e53fcc.png

acd02e1f1c7a1476a7c5b0c6bb494b81.png

Couchbase做的事情也很好理解,就是MongoDB的直接竞争对手,也是一个开源的NoSQL数据库(这个开源有点勉强,后面会说到),与MongoDB一样是document oriented database。

老习惯,上目录,就从几个角度聊一聊:

  • 基本面:最火的赛道,最中庸的metrics

  • 产品的本质:技术和性能不是万能的

  • 开源的意义:开源不是freemium这么简单

  • 变革的决心:错过Cloud就错过了一个时代

  • 开源商业化:产品和社区决定了天花板

基本面:最火的赛道,最中庸的 metrics

从商业基本面上看,Couchbase 2020年$100+M ARR 也就刚刚过了 SaaS IPO的合格线,27% YOY growth,仅为110+%的 NDR,这些指标都远没有达到市场对于一个高增长SaaS公司的期待。大家所熟知的 Rule of 40, couchbase 仅为20+。这个结果其实在一级市场就有反映,公司成立了近10年,8轮融资总共$251M,仍然没有成为 unicorn,所以这个 IPO 也是上得有些勉强。

361a1a75dc3ba75efb1a383a9a30628c.png

要知道,现在美国 SaaS 市场虽然整体估值比起2020年最疯狂的时候下调了不少,但是愈发明显的一个趋势是,二级市场的估值越来越像成长期投资,对成长给极高的溢价。下面是根据2020Q2最新数字总结的,美国二级市场 SaaS 公司运营指标的中位数(credit to Jamie Ball,链接在文末),大家就大概知道 couchbase 的经营指标在整体行业中是什么位置了。

0fdbcc0784fa8b45a4fa8752c7f859af.png

可以看到,虽然 couchbase gross margin 接近90%,但是 Growth rate, NDR这些指标,都勉强在中位数水平,显著低于投资人对于 IPO 阶段、$100M ARR 体量的公司的预期。这个不到10x PS的估值,也就不意外了。

因为最近开源和 infra 在中美都火得不要不要的,那么我们简单对比一下 Couchbase 和 MongoDB 两个开源的数据库,有几点思考,希望跟大家分享交流一下。

产品的本质:技术和性能不是万能的

有时候一些创业者说,我做了一个超级快的数据库,一定会有人用。

在 infra 中真的是这样吗?

要知道,真正能在纯性能上绝对高于所有竞争对手10x的革命性技术坦率来说是极少的。大家都知道 benchmark 就跟人工智能领域刷榜一样,总能找到最 favor 自己的场景或者做针对性的优化。Database 虽然是底层产品,也是跟应用场景以及使用者/开发者的习惯息息相关。

任何产品的优化都不免要面临一些 tradeoff, 对这些 tradeoff 的选择,本质就是对场景和用户的理解。比如最经典的数据库设计中要考虑的 CAP (Consistency, Availability, Partition tolerance)问题。

noSQL 数据库200多个,MongoDB 作为后来居上者,现在在 DB-engines 整体排名中高居第五,甚至碾压 AWS,GCP 等大厂。Couchbase 在整体排名中仅为29名(要知道,底层软件相对来说头部比较集中,20名之外基本已经是边缘产品了,这也解释了为什么成立十年的 couchbase 收入仅有$100M出头)。即使在细分的 document stores 里,排名第4的 couchbase 也明显被各种后来者超越。

e952f45bdea6e11ce10dc8f382e2c2d9.png

Couchbase 和之后合并进来的 Membase 都脱胎于 Apache CouchDB,release 的时间和 MongoDB 并无很大差异。在一开始,其实二者的绝对 performance 并没有这么大的差别。但是下面这个对比,可以看出一些设计思路上的差异。

aaa1d017e1c415e7fc642dbc45795ef7.png

4f52c28a64b9194341ea02b7ea89d2b1.png

但是 MongoDB 有几个设计,跟 couchbase 比起来未必是 apple to apple 的优劣,但是更符合用户的需要。

比如在 CAP 中,MongoDB 明显的倾向 CP,虽然牺牲了一些 Availability,但是 Scale 更快。在当时(2010-2015年之间)数据量开始大规模增加,要开始考虑接受还比较新的NoSQL数据库的公司,遇到的痛点首先就是应对快速增长时,兼顾规模和效率。相比之下,Couchbase 在 replication 和mobile 上的优势,在当时的环境下似乎有些鸡肋。

而且,虽然 read, write 都很快当然最好,但是对于分布式数据库的需求主要是业务,也就是数据使用侧的推动,MongoDB 优先 read 性能,而不是试图做到两手都抓,反而适应当时的业务环境。

ab50799b2b30fad0e318fa8d285966be.png

此外,MongoDB 的 Query 更接近于大家熟悉的 SQL,C++比Erlang 更通用。这种一定程度上的熟悉性,非常符合一个新的、基于社区传播的产品易于上手的需要。让大家接受起来更容易。

除了技术之外,marketing 也是不可忽视的一环。经过一系列重组的 Couchbase (CouchOne, Membase 两家公司来源于 Apache CouchDB,合并为Couchbase…), branding 越来越 confusing. NoSQL 彼时还算是新兴行业,本来就需要集中火力做市场教育,公司本身产生了很多不 consistent 的对外 messaging,这真是早期发展的硬伤。

话说回来,能在产品和技术上做出这样的取舍,一部分原因来自于创始人的基因和出发点吧。

4c0f72aff1de5e16c6d378aed8ea771b.png

MongoDB 上市照片,中间是今年才离职的 co-founder CTO  Eliot Horowitz,

他的右边是商业化大功臣 Dev Ittycheria

很多硅谷 infra 的创业者,都是原本自己是这个产品的使用者,感受到了产品本身的局限和痛点。这种一手的经验,而不是单纯的技术创新,是非常加分的出发点。MongoDB 的创始人是基于自己原本的互联网广告公司 DoubleClick(后来被Google收购)业务中使用 tabular database 的痛点,而产生了做 NoSQL database的想法(这个故事感觉有点像百度出来的 DorisDB 哈哈)。而 Couchbase 一开始,更像是基于 CouchDB 的商业变现。虽然不是绝对,也对后来的一些产品选择有了直接间接的影响吧。

所以投资人这么关注 why this, why you,还是很有理由的哈。

开源的意义:开源不是 freemium 这么简单

Couchbase 虽然诞生于 Apache 社区的 CouchDB,但是经历了重命名成 CouchOne,又跟 Membase 合并等种种事件后,开源社区已经基本上荒废。S-1中的 Go-to-market 也完全没有提开源社区。所以可以认为,couchbase 基本依赖传统自上而下的 sales 。

然而 MongoDB 一开始就极其重视开源,借助社区力量形成了 NoSQL RDMS 的行业标准。这个活跃的社区不仅为 MongoDB 早期的商业版带来了高质低价(当然 marketing 也不便宜)的 leads, 也成为日后 Atlas (managed service)的基础。

这两种做法从数字上看也是非常明显。2020年的 Sales & Marketing 占收入比重,Couchbase 高达70%,而MongoDB仅为50%左右。而2017年 MongoDB 上市的时候,这个数字也高达70+%,不到5年的变化相当显著。

Couchbase S-1:

f8e64db0907f536b14c04aeeec11210e.png

MongoDB 2020年报:

b77dc6e565f368c7b8754e2179c2318e.png

当然,这个数字也不是可以做单一评判的指标。Snowflake 去年上市的时候,这个数字甚至超过100%。但是当时公司 ARR $500+M 和收入增速高达120+%!所以按照现在美国二级市场对 SaaS 公司高成长性的偏好,这种利润换增长的方式,仍然被市场接受。相比之下,不到30% YoY growth 的couchbase 就非常不讨好。

从资本效率的角度来看,两家创立时间差不多的公司,IPO 之前,Couchbase 总融资$251M, MongoDB $311M,但是2020年收入来看,后者是前者的5倍还多。资本效率的差距不可谓不大。

这里其实值得多说几句的是,开源的价值到底是什么?

很多人要么认为开源就是技术圈的理想主义,要么只是当做一个 go-to-market 的手段。M小姐看来,这都未免以偏概全,甚至有可能极大误导一个企业的开源战略。

在a16z那篇著名的开源实操文章,Open Source: From Community to Commercialization 中,这个模型其实总结得非常清晰。

1d12cad2aac047fd4f8169d6398b794e.png

这个 flywheel 右侧几种商业化模式,包括上一代的 Redhat 式的服务、大多数开源公司采用的 open core, 和实现第二曲线增长的 SaaS 模式,都只是开源价值变现的结果。M小姐以为,开源核心的价值创造,来自于 speed innovation. 因为有了(经过选择的)最优质客户的共同打磨,在各个真实场景的迅速测试,优秀人才的经验共享和共建,才能打造出有技术竞争力的产品,才能成就商业价值。

上周的 PingCAP Devcon, CEO 刘奇有一句话说的也是这个意思:

真实场景是最好的架构师。

而对于一个诞生于 startup 的 infra 产品而言,让自己的产品迅速在各个场景中经历打磨洗礼、升级换代的最有效的方式,就是开源。这也是开源最大的价值(如果不是之一)。

所以,衡量一个优质的开源项目/公司,核心是看这整个链路是否打通。没有社区共建的商业化,和没有真实场景的技术创新,都是片面的开源。

变革的决心:错过 Cloud 就错过了一个时代

Cloud 是大势所趋,虽然 MongoDB 和 Couchbase,或者说绝大多数的开源 infra 公司,都是从卖企业版的 open core 模式起家,但是 MongoDB 借助 SaaS 业务实现第二曲线腾飞的自我革新,绝对是商业史上值得称道的经典。

MongoDB 2007年成立的时候,云计算还不知道在哪里。一开始的近十年时间,都是经典的 Open core 路线,给大客户卖商业版 MongoDB Enterprise,公司自己 manage 底层基础设施。

但是云计算方兴未艾的2016年,就推出了 SaaS 版本 Atlas。


2017年上市的时候,这部分收入还不到当时 MongoDB $100+M 总收入的1%(没错啊,2017年 MongoDB 的收入就跟 Couchbase 现在的收入差不多了额)。而 Couchbase 直到2020年(!)才推出 Couchbase Cloud,相差了5年之久!

要知道,现在 MongoDB Atlas ARR 都达到总收入近一半,超过$200M了,增速还高达40%,俨然成为了第二大业务支柱!成长速度绝对惊人。

00567695b8e728d744cb9134a5767048.png

这种 SaaS 服务现在听起来很顺理成章,但是对于当时已经围绕 Open-core 打造了一整套营销、sales 和产品体系的 MongoDB,SaaS 这个关键的第二曲线对整个组织可谓是不小的挑战,也是对掌舵人战略眼光的考验。这个难度可以说对于需要同时攻克 enterprise 大客户和 SMB 的 SaaS 公司来说,是共同的挑战,可以单独一个专题来说了,今天暂且不表。

就说一个简单的点,看看下图两种产品的平均合同额,SaaS 产品还不到企业版本的十分之一,就知道 SaaS 和 Opencore 模式面对的是完全不同的两个客户群体。但是稍微熟悉 B2B sales 的同学都知道,卖传统的软件跟 organic 驱动的 SaaS 产品,光是对销售的激励方式都非常不一样,同时 manage 两种营销组织体系的坑真的不要太多。

M小姐想说的就是,这种企业业务、组织和文化层面的全面升级,值得让我们对 MongoDB 的管理层刮目相看。(这个要感谢的,就应该是2014年上任的 CEO)

1ab859ed227ce660f73c2aa4e72f8f6b.png

相比之下,Couchbase 有两个现在看来可以说是弯路的决定。

一是花了很多精力做 mobile 平台的 support, 后来被证明是一个比想象慢的多的市场。这个2014年 launch 以来就一直不温不火的需求仿佛是将公司拖入了尾大不掉的泥潭。Mobile 的收入甚至都没有在S-1中单独披露,可以想象即使在今年也乏善可陈。中间这么多年增长乏力,不知是不是机会成本的原因,似乎并没有什么转变的意识。

更致命的,就是在云计算的时代到来的时候,公司没有及时转向 SaaS 模式。在 SaaS 模式已经成为几乎所有商业开源软件的标配的时候,Couchbase 的 SaaS 收入也还几乎可以忽略。

看到这个巨大的差距,可以让大家从另一个角度理解,创业者所需具备的战略能力是怎样的。能支持各种 mobile devices, edge computing 场景的 NoSQL database, 不能不说是一个技术有亮点的功能。但是在市场印证上,在行业关键拐点的识别上,一两个大的判断,真的有可能带来公司天壤之别的发展。

为什么创始人要建立好组织,让组织和高管团队帮助自己脱离日常的运营细节,才能在必要的时候,跳脱出来,仰望星空,做重大的决定。Bezos 就说,他一年只需要做2-3个决定,但是 Be right, a lot. 

开源商业化:产品和社区决定了天花板

看看 Couchbase 的商业化,也不能说就不成功。至少,很符合国内大家追求大客户的思路。

经过这么多年的发展,couchbase 的大客户数据还是不错的

  1. 公司549个客户横跨50个国家( infra 公司天生就要国际化呀)

  2. 23个客户 ARR 超过100万美元。这些客户自他们与 Couchbase 签订第一份合同以来,ARR 增长了20x!

  3. 来自 ARR 超过50万美元的大客户的收入,占了总收入的56%

而且,刚开始的时候,很多人觉得 NoSQL database 还不适用于 Mission critical 的应用,现在,据称80%的 Couchbase 客户已经将他们的数据库用于部分或大部分业务的source of truth or system of record了。

然而!为什么 couchbase 的体量会比 MongoDB 小了这么多呢?这对于更多涌入的玩家,有什么启示?

当然,数据库这个池子是足够大(至少也是500亿美金,10+%增长率),AWS 也是在宣扬 Purpose built database, 所以百花齐放是必然。但是我们从权威的 DB engines 其实可以看到这个市场的几个特点:

首先,集中度相当高,头部效应明显。从下图 DB engines 的 ranking 不难看出,前5-6名跟其他玩家的差距相当大。没有挤进前5名,或者增速不够快,天花板都是不高的。

这个其实也不难理解,一方面,数据库是需要不断跟场景打磨的底层产品。越是头部,越是有更多的用户一起来不断提升产品的性能和适配场景。另一方面,底层产品的粘性足够高。都是至少120+%(对比一下,MongoDB 超过120%,Snowflake更是令人发指的145+%!)。所以 couchbase 115%的 NDR 在一般 SaaS 中也许不错,这个品类中只能算中流。

d52c4b2bd0a8803f73e74275fedf9795.png

此外,上图也可以看出,过去几年的数据库领域真是迎来数十年一遇的大变局。云计算+数据两大驱动力,无须赘述。很多2011年之后的数据库都得到了蓬勃发展,百舸争流,很多老牌玩家都在被超越。


几大云厂商自不必说,渠道优势杠杠的,老牌的 Casandra, IBM Cloudant, PostgreSQL, RavenDB, 等等,也都在这个大变局中地位开始摇摆。这个摇摆,就让大量的新势力得到了发展的空间。

第三,开源在这个变局中是一股关键的力量。2021年是 Open source license 数据库全面超越 commercial license 数据库的关键一年。

b485c8bfb28da97c59dcf0dbe606d9b8.png

有了云计算的推动,有了数据爆发驱动的场景和痛点,这个传统无比sticky的市场开始有契机来接纳还没那么完美,但是可以解决一两个关键问题的新的基础设施(比如当年被大家一边骂一边用的 MongoDB,历史多么熟悉)。

正如前面所言,开源的意义是什么?这里又多了一点,就是跑马圈地,占领场景和心智的高地。

看看 MongoDB 2017年 S-1,项目开始到5M download,花了超过5年的时间。而上市的时候,虽然跟现在的 Couchbase 类似,年收入在$100M 上下,但是累计下载量已经超过3000万!这就意味着,这些社区里的公司,基本已经不大可能使用别的直接竞品(除非10x better?!)。

1d57aa8c304711d85a05819153a2fbe3.png

而这些公司的价值,从产品的角度而言,正如前文所提到的 flywheel,他们所贡献的场景和 contributor,让一个 startup 得以迅速测试这么多环境,是融资再多也很难买到的。

从商业角度而言,不论是作为大企业客户的 lead generation, 还是直接成为对于中小客户的 freemium 模式,更是不可估量。这就是为什么在 MongoDB Atlas launch 不到两年的时间里,2018年客户数量就超过了3000!

对比一下,Couchbase 依赖传统 sales 路线自上而下发展,2020年总用户数541个,YoY 增速还不到10%。当然,Snowflake, datadog 等也都是自上而下的大客户路线,仍然很成功。虽然不能一概而论,但是对于一个使用者更多元的市场,一个迭代速度要求更快的产品,开源相信是所有 infra 产品至少需要认真考虑的道路。

不过,知易行难。

一方面,这需要开源社区运营者有极大的耐心,在前期做产品的深耕和打磨。我很喜欢的一句话,来自熊飞总(啊我当然不是拍老板马屁!):


开源早期做好产品和社区(标杆用户),就是最好的商业化。

另一方面,底层软件的 B2B 市场,本身就容易有很多付费意愿很强的用户(大多数是传统企业用户)。买咨询买服务。初创公司太容易陷入尽快商业化,收割现金流的短视循环中。做商业化开源产品,要能够坚持长期主义,早期站稳地盘,中期设计商业化产品,后期发展多维度 go-to-market, 其实对创始团队和组织的要求或许更高更多元。

当然,很多人也许还想要谈论 MongoD B 的 license 选择,是否帮助他们抵御了公有云厂商的冲击。这就可以另外开一个专题了。但是M小姐觉得,License 选择在后期大规模商业化中自然有影响,但是很简单地说,大多数产品都没有能够对AWS 自己的产品产生威胁的程度,杞人忧天个啥?

fe94f41791430c5ac443b6a25851641b.png

总结一下:

  1. 商业基本面:现在开源和infra在中美两边都是红得发紫的赛道,但是 Couchbase 作为老牌玩家,从收入、增长率、retention 等关键指标来看,在美国二级市场 SaaS 公司中,仅为中间偏下水平。因此 PS 和市值也不高。

  2. 产品方面:虽然两个直接竞争对手 MongoDB 和 Couchbase 早期在性能上没有本质差异,但是即使是数据库这样的底层产品,更符合已经有明确需求的场景、更贴近现有用户的使用习惯,以及更清晰的 marketing message,这些产品设计上的考量,对于产品的成功很多时候不比性能本身重要性低。

  3. 开源的意义:开源不只是一种 go-to-market 的方式。开源社区的核心价值在于集合所有开发者的力量更快迭代,在更多的场景中打磨产品,最终形成行业标准。没有社区共建的商业化,和没有真实场景的技术创新,都是片面的开源。

  4. 模式变革:MongoDB 抓住云计算的机遇迅速转型,推出 SaaS 服务 Atlas,形成二次增长曲线。这是对战略眼光和组织变革能力的极大考验。Couchbase 没有及时从萎靡的 mobile 端需求中跳出来,2020年才开始做 SaaS,可谓是错过了一个时代。

  5. 开源商业化:产品和社区决定了商业化的天花板。开源早期做好产品和社区(标杆用户),就是最好的商业化。MongoDB 几千万的 download 量成为日后商业化成功和 Atlas 华丽进化的基础。

这是开源最好的时代,群雄逐鹿,亦是最有挑战的时代。

Reference:

Couchbase s-1,MongoDB 10k

https://db-engines.com/en/system/Couchbase

https://cloudedjudgement.substack.com/p/clouded-judgement-71621

https://severalnines.com/database-blog/battle-nosql-databases-comparing-mongodb-and-couchdb

https://a16z.com/2019/10/04/commercializing-open-source/

https://www.moritzplassnig.com/saas-and-moving-downmarket-mongodbs-transformation/

https://medium.com/memory-leak/couchbases-s-1-analysis-sofa-so-good-%EF%B8%8F-eec65cb21d07

https://www.quora.com/What-is-the-difference-between-couchbase-and-mongodb

https://www.bvp.com/atlas/measuring-the-engagement-of-an-open-source-software-community

相关阅读 | Related Reading

c7b021a7de33717a9eefea6c5d171a24.png

COSCon'21 讲师征集令

619f373305d335a5ade99d00e3f50031.png

2021 中国开源年会 (COSCon'21) :开心开源 Happy Hacking

928d0cf6c3d118d6912a83daf4518b42.png

新微信公众号启用说明

开源社简介

开源社成立于 2014 年,是由志愿贡献于开源事业的个人成员,依 “贡献、共识、共治” 原则所组成,始终维持厂商中立、公益、非营利的特点,是最早以 “开源治理、国际接轨、社区发展、开源项目” 为使命的开源社区联合体。开源社积极与支持开源的社区、企业以及政府相关单位紧密合作,以 “立足中国、贡献全球” 为愿景,旨在共创健康可持续发展的开源生态,推动中国开源社区成为全球开源体系的积极参与及贡献者。

2017 年,开源社转型为完全由个人成员组成,参照 ASF 等国际顶级开源基金会的治理模式运作。近七年来,链接了数万名开源人,集聚了上千名社区成员及志愿者、海内外数百位讲师,合作了近百家赞助、媒体、社区伙伴。

212af1afea840ec1199230f1f2491b94.gif

欢迎大家点击阅读原文查看原文!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值