Cursor 成功的背后:两个 PMF

7228c4d11dc2fcbd49d6fcaaad0edee7.gif

作者 | Hailong Zhang

责编 | 王启隆

出品丨AI 科技大本营(ID:rgznai100)

Cursor 最近在社交媒体上大红大紫,产品体验确实做的好,我也从 VSCode 切换到了 Cursor。Cursor 刚成立的时候非常难用,但两年之后终于跑出来了。在我印象中,Cursor 是少有的不信邪,硬刚大厂成功的案例。

42b99e7c36ce9344ab9d9b975c43cd56.png

Cursor 在 23 年 9 月获得了来自 OpenAI 的天使投资,又在 24 年 8 月宣布了 6000 万美金的 A 轮融资

d73043039fbe20e89538ca8066a4257d.png

正面硬刚 GitHub

Cursor 背后的公司叫做 Anysphere,成立于 2022 年,Cursor 是他们的第一款产品,2023 年发布。在 Cursor 发布的时候,Coding Copilot 领域实际上已经发展了相当一段时间,并且有好几个大玩家在做。

1. GitHub Copilot

GitHub Copilot 于 2022 年 3 月底在 VSCode 上正式推出,在 24 年 1 月份已达一百三十万付费用户,是目前 用户规模最大的 Coding Copilot 产品,并且仍然保持高速增长。

2. Codeium

Codeium 在 2022 年转型做 Coding Coilot 产品。今年八月底披露了 一亿五千万美金的 C 轮融资,目前有 70 万免费用户,并在企业级市场达成八位数的 ARR 。

3. Cody

主营代码搜索的 Sourcegraph 在 2023 年底推出的新产品线,目前没有披露用户数据,Sourcegraph 曾在 21 年披露一亿两千五百万美金的 D 轮融资

4. Tabnine

2019 年上线的 Tabnine 目前已经获得 2500 万美元的 B 轮融资,根据披露的数据,2022 年其用户量达到 100 万,并获得 580 万美元的收入。

这个赛道除了 GitHub Copilot 商业化的特别成功,其他虽然融了很多钱,但都发展的比较缓慢。这个时候,有几个年轻人跳出来说要做一个 AI Native IDE,基于 VSCode 魔改,用 OpenAI 的模型,挑战微软(GitHub)。初生牛犊不怕虎,基于大厂的技术,挑战大厂已经大规模商业化的产品。这个故事要是发生在中国,投资人第一个问的问题就是“你这事儿要是能成,为啥 GitHub/微软自己不做呢?”,“GitHub Copilot 已经那么多用户,并且商业化的很成功,你有什么优势呢?”。但,即使是这种听起来非常不靠谱的故事,依然筹集到了 800 万美元。

db1e0c347ac98448f9be85fff68fa429.png

破局的关键

从技术的角度讲 Cursor 的成功就是一句话:在几乎一样的技术基础上,找到了更好的产品化的方式。这是一个非常典型的 Product-Market-Fit + Product-Model-Fit 的案例。这个更好的产品化体现在哪里呢?最核心的只有一条:AI 对于单一文件的多处修改/多个文件的同时修改。这里的详情可以参见 Cursor 官方博客 https://www.cursor.com/blog/instant-apply

1. AI 底层技术的快速发展解锁了更多场景

在 GPT-4 甚至 GPT-4-Turbo 时代,Cursor 想要的产品体验是做不出来的,因为底层模型太慢了。但是 2024 年上半年出现了 Sonnet 3.5 以及 Llama 3。虽然这两个模型在智力上并没有超越 GPT-4,但是性能更好了,并且 Llama 3 的出现第一次让应用侧有了一个智力正常的可以微调的模型。这两个点放在整个行业可能没啥,但是恰恰是解锁 Cursor 设想的产品体验的核心要素。这是 Product-Model-Fit。

34230e9cbbcb47fa051a79d4f497a593.png

OpenAI HumanEval 测评集得分随时间变化

2. 能形成商业闭环

Cursor 的产品体验脱胎于 GitHub Copilot,可以说 Product-Market-Fit 是 GitHub 帮 Cursor 做的,就是这个产品形态,以月费的形式向个人开发者收费能行得通。所以 Cursor 其实从 Day 1 就形成了商业闭环,这一点在国内也是不成立的。硅谷的开发者非常愿意为了效率自掏腰包,哪怕只有少量改进。

3. 大厂反应很慢很慢

你难以想象 Cursor 是在 GitHub 的眼皮子底下抢用户,然后 GitHub 似乎没有任何反应,到目前为止。Cursor 现在的产品体验并不是只有 Sonnet 3.5 能做到,GPT-4o 也是可以的,但是为啥 GitHub 没做呢?有人说是因为 VSCode 和 GitHub 是两个部门,有部门墙?但凡 GitHub 内部稍微有点话语权的人想干 Cursor 的事,都可能把 Cursor 扼杀在摇篮里。但,这种事情在硅谷往往不会发生。某种意义上,这也是 Product-Market-Fit。

以上三点,我认为是 Cursor 成功的必要条件,但这些条件对于很多创业公司都是一样的,为啥其他人没成呢?最关键的还是 Cursor 做了一个正确的产品假设,然后一直在打磨以及等待技术的成熟使得这个假设成立。正确的问题往往比解法更重要。不知道这里远见占了几分,运气占了几分?

08adb4d8db20245b709a7610a1be0d2a.png

爆火下的隐忧

既然用户因为一定程度的产品体验改进,很容易从 GitHub Copilot 迁移到 Cursor,那是不是意味着也很容易迁移走?这就涉及到 Copilot 这类产品的模式问题。实际上真正的护城河是 VSCode,不是 GitHub Copilot 也不是现在的 Cursor。VSCode 已经从一个简单的编辑器变成了一个平台。用户之所以能从 GitHub Copilot 很容易的迁移到 Cursor,是因为他们都寄生于 VSCode,用户的使用习惯,体验,功能/插件都完全一样。如果 Cursor 不能迁移 VSCode 现有的体验,那它一定不能以现有的这些改进来让用户放弃 VSCode。要复制 VSCode 生态带来的各种插件和可扩展的能力非常非常困难。如果你关注这个领域,你大概知道最近还有另外一个 IDE 开始被人关注到 Zed(zed.dev)。从工程角度来讲 Zed 的工程复杂度至少是 Cursor 的 10 倍,因为 Zed 从零开始自己写了这个 IDE,完全不依赖 VSCode,并且也集成了 AI Copilot 能力。但是从目前用户的使用来看,Cursor 至少是 Zed 的 10 倍。确实,选择比努力重要。

所以无论是 GitHub Copilot 还是 Cursor 都是 VSCode 生态里的工具,对于开发者来说就是一把更好的锤子,本身不具备网络效应等护城河。另外 Cursor 这事儿也证明了 Copilot 产品所谓的数据飞轮是不存在的,GitHub 先发这么多也没有在产品体验上拉开差距。你能拿到的数据,大模型都能拿到,已经是模型的一部分了。

0c56ce7a7526cc812da9f0c7a2f25441.png

What Next

今年六月份的时候我在硅谷听过一次 Cursor 创始人的演讲,他们的核心思路就是造牛逼的工具让 Human Developer 变成 Human Super Developer。这个理念实际上是比较另类的,我记得当时那个分论坛叫做 Developer Agent,只有他们一家在讲 Copilot,其他人全部在讲 Agent。

Copilot 是不是 Agent 的路径?目前并没有共识,我认为不是。虽然 Cursor 目前没有做 Agent,但是我觉得他们会改变这个想法。

前一阵子 OpenAI 发布了 SWE-bench_Verified https://openai.com/index/introducing-swe-bench-verified 测试集,是目前这个领域最权威的 benchmark。赛道刚刚开始,但已经竞争激烈,你会看到很多跟 Copilot 领域完全不一样的玩家:

7c2dc9fac88d49996471def72928ed7d.png

 SWE-bench_Verified 是用于测试 AI 解决真实世界中软件问题的测评集

目前 Agent 产品形态的技术基础是不成熟的,即使我们(gru.ai)已经是目前的最高分,但也只有 45 分左右,远远达不到实际商用的标准。

根据之前 OpenAI HumanEval benchmark https://paperswithcode.com/sota/code-generation-on-humaneval 的经验,我们估计等这个榜的分数普遍在 70 分以上的时候,这个领域才具有商业化的技术基础。可以说目前 Agent 领域两个 PMF 一个都没达成,没有被验证过的产品形态,没有成熟的技术。

但这个领域依然吸引了非常多的注意,我们看到有越来越多的创业公司在加入这个领域的竞争,光 YC 就毕业了至少 3 个相关团队。一方面大家在努力竞争技术储备,另外一方面在努力寻找商业化的落脚点,从解决软件工程中的小问题开始,例如写文档,写测试等等。当然,这个领域也被很多人质疑,这是普遍存在的非共识。

fc27cabe3b93d6b409f988ec3f96599c.gif

cb693985348e682230ce426b3578fc0b.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值