魔鬼藏于细节之中。
在我们深入探讨细节之前,让我们先在 30,000 英尺的高空翱翔一会儿。
每一次技术的转变都会创造价值转移的机会。
目前,Gen AI 的炒作主要集中在基础模型层上,这主要得益于 ChatGPT 的全知性。然而,基础模型与上下文无关,这是其全知性的一个特性,而不是缺陷。
我相信,随着价值从基础模型层转移,我们将在 Gen AI 中看到新的价值发挥。
利用这种价值转移获取优势的公司需要遵循以下四步流程:
- 利用水平来垂直发展(拆分开始)
- 开发垂直获胜权(拆分成功)
- 横向发展获胜权(重新捆绑开始)
- 利用垂直来转向水平(重新捆绑成功)
以下是这一演变在整个价值链中的表现。
步骤 1:利用水平来垂直
基础模型迅速占领市场,并在模型层确立了横向主导地位。
在此阶段,一系列“初创企业”出现在工作流层,以垂直化这一水平模型。过去一年,我们看到了这一现象,出现了一大批人工智能“包装器”模仿者。在此阶段,价值继续完全停留在模型“水平”上。
开始拆分:此时,这些“初创企业”已开始首次尝试将水平基础模型拆分为垂直用例。
第二步:发展垂直制胜权
这些“初创企业”中的一些可能会开发出某种垂直优势(专有微调模型、垂直数据集访问权、垂直特定的 UX 优势或以上所有优势的某种组合),并利用该优势将价值带入垂直领域。
成功拆分:此时,少数成功的拆分者脱颖而出,拥有垂直竞争和获胜的权利。如果其他 AI“包装器”拆分者主要依赖基础模型,而没有任何自己的专有优势,则会迅速商品化。
步骤 3:培养横向获胜的权利
这是关键的一步。
在发展出垂直优势后,成功完成第二步的少数公司会发现自己通过垂直专业化拥有了关键控制点——这一优势让他们在垂直领域占据了用户关系的主导地位。我将深入探讨这些控制点的性质以及如何构建控制点。
这几家公司将利用这个新开发的控制点开始重新捆绑“过度”。
重新捆绑开始:此时,少数“初创企业”出现,声称拥有在更高(工作流)层重新捆绑价值的权利。
步骤 4:利用垂直方向实现水平方向
随着围绕控制点的重组不断推进,这个“初创企业”现在成为其他玩家连接的枢纽。它成功地创建了一个协调多种功能的“over-the-top”层。
成功重新捆绑:这样,我们就有了新的赢家。价值成功重新捆绑并迁移到这个新的层(和参与者)。
当 Gen AI 等新技术出现时,这种不可避免的拆分和重新捆绑循环是价值转移的关键。我将简要解释一下这个循环如何决定赢家和输家,以及如何利用它来为你带来优势。
正如您所想的那样,这篇文章是关于从包装器到赢家的转变;我们谈论的不是 GenAI 工具其他层面的价值。LLMOps 和 Compute 中会有赢家,这主要取决于工程、规模和人才优势。但这篇文章是关于在将 GenAI 交付到产品中时获胜的。
现在让我们深入了解其中的细节。
包装拆分的平庸
包装器到底起什么作用?
他们试图拆分。但他们做得很平庸!
基础模型是水平的,用户需求是垂直的。
基础模型声称几乎所有问题都有概率答案。
他们让普通用户着迷,因为他们似乎对所有事情都有自己的看法。这在一定程度上解释了为什么 ChatGPT 是有史以来最快达到 1 亿用户的平台,以及为什么周末晚宴上的闲聊从讨论 Sam Bankman-Fried 的服装选择变成了“ChatGPT 会抢走你的工作吗?”。
然而,基础模型对专业用户来说并不那么有用。要让它们产生对你最有用的特定输出,需要一组非常具体的提示。
进入提示工程的世界——这是一个花哨的术语,它让你跌跌撞撞地(通常通过反复试验)找到最能提供最有用和最可用输出的提示。
结构良好的提示将基础模型分解为最终用户用例。
包装器本质上将这种解绑打包到一个用户友好的界面中。
因此包装器将水平的基础模型垂直化。
但除非包装者创造出专有的垂直优势,否则这种垂直化并不真正等同于成功的拆分。
GenAI 包装器:发展垂直优势
那么包装商究竟如何发展专有垂直优势呢?
以下是用于开发垂直优势的简单的 GenAI 包装器剧本:
- 先进的提示工程 + 精心设计的用户体验推动工作流程参与
- 工作流程参与推动丰富的数据捕获
- 数据捕获有助于模型微调
- 微调模型推动更大的工作流程参与度
这是一个简单的飞轮来解释这一点:
及时的工程设计 + 精心设计的用户体验有助于推动初步采用。包装器将最终用户的非复杂输入转换为明确定义的提示(大大降低了最终用户通过反复试验迭代到正确提示的成本),这有助于生成非常有用且可用的输出。
Harvey、Ironclad和Bloomberg GPT等垂直解决方案在很大程度上遵循这种策略,围绕其最初的“包装器”拆分建立垂直优势。
模型微调有助于围绕基本包装器建立专有垂直优势,具体方式如下:
- 提高特定用例的模型性能
- 减少模型尺寸/成本并提高模型经济性
小型模型在特定领域数据上进行训练后,在延迟、准确度和成本方面的表现优于大型基础模型。这种垂直化有其自身的强化反馈效应。您开发的垂直优势越多,您在所有参数上的竞争力就越强。
为了随着时间的推移提供最引人注目的垂直解决方案,模型的微调越多,未来的 UX 变化就应该与模型进行越深入的耦合,以便将该模型的优势传递到用户工作流程中。
这给我们带来了一个有趣的难题,即如何利用 Gen AI 发展垂直优势。
在人工智能领域发展强大的垂直优势的组织障碍
真正通过垂直优势实现差异化的解决方案是将模型改进与 UX 创新深度结合的解决方案。
缺乏模型微调的后期追随者如果没有微调模型支持,将很难提供相同的用户体验创新。
这种结合听起来很容易,但做起来却很难。而这其中隐藏着一个优势,正是它决定了垂直解决方案中的输家和赢家。
但为什么公司会努力将模型改进融入用户体验?这怎么会成为优势呢?
从组织结构上看,模型专家与用户体验设计师相差甚远。绝大多数优秀的模型工程师和数据科学家都是横向导向的。他们专注于构建能够按规模和范围交付的模型。这在构建基础模型时是一种优势。但这与培养对客户痛点的深度同理心是相悖的,而后者是将模型微调优势带入用户体验所必需的。
这就是正交性的样子。
更重要的是,大多数模型工程师都是在构建基础模型方面积累经验的,与需要深度客户同理心才能取胜的用例相去甚远。这些模型工程师越来越多地被希望发展垂直优势的公司聘用。少数人将成功与用户体验设计师深入合作,在两层之间建立紧密的联系。
为了在 Gen AI(以及所有形式的 AI)中发展强大的垂直优势,您需要提供一个组织模型,以确保由模型工程师和 UX 设计师组成的团队的快速开发周期。
这就是你作为 Gen AI 包装器获胜的方法......通过开发真正的垂直优势。
但你仍然没有在 Gen AI 中获胜!
发展垂直优势作为点解决方案只是利用 Gen AI 确立制胜地位的第二步。
魔力就在于有利的垂直位置之后会发生什么……
为了理解这一点,我们首先需要看看重新捆绑
拆分带来颠覆,重新捆绑带来风险回报
作为一个垂直的、点式的解决方案,您现在已经成功实现了拆分。
大多数对现状的“破坏”都是通过拆分实现的。但大多数风险投资回报是通过重新捆绑实现的。
专注于一项活动的金融科技公司将银行分拆出来,专注于某一方面的健康科技公司将医疗保健提供商分拆出来,专业的能源初创公司将公用事业分拆出来。
然而,拆分并不能带来可持续的价值获取。拆分会取代现有企业,但不会创造可扩展且可防御的价值池。
这是通过重新捆绑实现的。重新捆绑涉及将多个未捆绑的功能捆绑成一个有凝聚力的以客户为中心的产品。
最重要的是,成功的“捆绑者”确立了枢纽地位,并获得了用户关系的首要地位。
风险资本追逐拆分,因为拆分者承诺重新捆绑并获取价值。然而,大多数风险投资都因极少数人重新捆绑而损失殆尽。
Square、Plaid、Stripe 是几家成功重组并主导价值链一个或多个水平层的金融科技公司。其他大多数公司则半途而废。
同样,人工智能领域的获胜者也需要一条成功重组的道路。
那么在 Gen AI 中重新捆绑究竟是如何运作的呢?
目前,Gen AI 的炒作主要集中在基础模型层上,这主要得益于 ChatGPT 的全知性。然而,基础模型与上下文无关,这是其全知性的一个特性,而不是缺陷。
微信策略——拆分和重新捆绑移动应用程序
在我们进一步讨论之前,值得看看以前发生过这种情况的地方。
2006 年,我刚开始在雅虎工作时,我们曾与诺基亚和其他手机制造商达成协议,预装我们的应用并将其推向市场。诺基亚将不同的应用组合捆绑在一起,打造出一款手机,然后将这些“应用包”手机推向市场
次年,苹果推出了 iPhone,随后又推出了 App Store,并拆分了这种“基于手机的应用程序包”,并通过操作系统和 App Store 重新捆绑应用程序。您可以购买通用的 iPhone(而不必使用诺基亚的 50 多种产品目录),并创建自己的“应用程序包”以满足您的特定需求
iOS 和 Android 已成为新的捆绑销售提供商。
与此同时,一些(实际上是大多数)移动应用程序最初都是作为底层 iOS 和 Android 功能的“包装器”开始的,并最终形成了垂直优势。
- Foursquare 和 Uber 最初都是谷歌地图的包装器,但在用户位置数据和司机供应方面形成了专有的垂直优势。
- 健康应用程序最初是作为 iPhone 加速度计的包装器,然后才捕获足够的数据来构建专有分析。
iOS 和 Android 是许多移动应用的性能瓶颈(就像模型对于 Gen AI 包装器一样)。随着底层操作系统的每次更新,应用的性能都可以得到改进和扩展。
但大多数成功的应用程序都是通过数据发展出专有优势,并最终围绕数据建立了商业模式。
但他们都没有利用这种垂直优势在 App Store 之上创建新的水平重新捆绑层。
直到微信在中国颠覆了拆分与重组的策略。
微信最初是一款在游戏和通讯方面具有垂直优势的独立应用。然而,它利用其在通讯方面的优势,将用户关系确立为默认通讯渠道的首要地位。随后,它将通讯与支付整合在一起,以控制两项最重要的横向功能,从而使其能够在底层操作系统之上建立一个新的层级。
用户大部分时间都花在微信上。这使得微信能够在操作系统层之上重新捆绑应用程序。电子商务、游戏、媒体等应用程序现在可以放在微信内。由于微信拥有跨应用程序通信和支付的一体化连接工作流程,用户永远不会离开微信工作流程。
微信一度在用户关系中占据首要地位,以至于苹果和谷歌的新操作系统更新不会对用户体验产生影响,除非微信将这些更新实施到其用户体验中。
重新捆绑使得价值能够迁移至价值链的另一部分。
微信是价值转移的一个案例研究,其中价值链中另一个位置的参与者如此成功地重新捆绑,以至于之前的领导者(苹果,谷歌)实际上被商品化。
只要用户在微信中运行应用程序,苹果手机上的用户体验与安卓手机上的用户体验并没有太大区别。
重新捆绑的权利已经从OS和App Store层迁移到微信管理的通信和支付层。
有许多应用程序自称是超级应用程序,但没有一个可以声称在底层操作系统之上创建了一个全新的默认工作流层。
重组的关键
那么,谁是 GenAI 的微信?——你可能会问。谁能在 Gen AI 中获胜。
第一层次的思考者会跳起来说“也许是 Slack — 拥有那个通信层。也许 Salesforce 的收购毕竟是有意义的。”
但答案更加微妙。
我们不是在寻找沟通层,而是在寻找重新捆绑的权利。
对于微信来说,它恰好是通信层,但对于 Gen AI 来说,它可能是其他东西。
— — —
重新捆绑有一个秘密。这个秘密显而易见,但很大程度上却隐藏着。
每个人都想重新捆绑。每个人都想成为中心。
但实际上很少有人能够做到这一点。
你不能只因为你想,就将自己置于生态系统的中心。
以下是成功重新捆绑的关键:
你需要掌握传递用户关系首要地位的关键控制点
微信为何能如此成功地进行重组?它拥有两个关键控制点——通信和支付——这使得它能够调解用户和第三方应用之间的所有社交和经济互动。
这将我们带到了“如何利用生成式人工智能取胜”的第二个关键步骤。
在 Gen AI 中创建控制点
让我们来看看人工智能;特别是预测人工智能和生成人工智能。
预测性人工智能降低了预测成本。
生成式人工智能降低了创造成本。
通过吸收预测或创造的任务(和相关成本),人工智能工具使用户能够在工作流程中做出决策和采取创造性行动。
用户的工作流程包含大量决策和创造性操作。然而,有一两个核心决策和创造性操作可以推动工作流程的其余部分。
要使用 AI 创建控制点,您需要确保您的 AI 能够支持工作流程中的核心决策和/或核心创意操作。
该控制点赋予您与 AI 一起设置枢纽位置的权利。
核心决策……以及核心创意行动
哪一个决策对于用户的工作流程至关重要,以至于所有上游活动都会汇集到该决策中,而所有下游活动都会以该决策为依据?
从那个核心决定开始!
哪一个创造性活动对于用户的工作流程至关重要,以便所有上游活动都汇集到该创造性活动,而所有下游活动都以该创造性活动为依托?
从核心创意行动开始!
让我们看两个例子
考虑一下人工智能在医学中的作用。核心决策与诊断有关。对于放射科医生来说,核心决策可能与解释射线照片中的图像数据有关。对于医生来说,核心决策可能涉及解释电子健康记录中的信息。
拥有这一核心决策权是一个关键控制点。拥有核心决策权的工具获得了用户(医生/放射科医生)关系的首要地位。上游工具(例如将非结构化对话转换为结构化 EHR 数据的工具)插入此工具。下游工具(例如向用户提供反馈的远程健康监测应用程序)集成到此工具中。此工具处于枢纽位置。
或者考虑一下人工智能在出版中的作用。核心创作活动与事实的证实和编辑有关。掌握这一核心创作活动是一个关键的控制点。提供输入或利用这一事实来源和编辑输出的其他工具插入到这一枢纽位置。
除非您拥有核心决策权或核心创意行动权,并且除非您的微调模型为其提供动力,否则您不太可能在工作流程中获得中心位置。
回到上面的 Salesforce-Slack 示例,你可以拥有水平通信层,并且如果该应用程序支持核心决策和/或核心创意行动,那么你就可以通过在该层上运行的应用程序进行商品化。
确立枢纽地位
枢纽位置有三个主要优势来源。大多数争夺人工智能枢纽位置的玩家都需要一个或多个此类优势来源的组合。
在预测性人工智能中:
- 决策工作流优势:您是否拥有核心决策所在的工作流?
- 决策智能优势:您是否拥有支持核心决策的专有模型?
- 决策关系优势:您是否与决策者具有关系优先性?
同样地,在生成人工智能中:
- 创意工作流程优势:您是否拥有核心创作活动所在的工作流程?
- 创造智能优势:您是否拥有专有模型,能够支持独特的关键(部分或全部)核心创造活动?
- 创作者关系优势:您是否与创作者的关系处于首要地位?
理想情况下,你需要这三种东西。
让我们进一步解析这个问题!
关键优势1:工作流程优势
您是否拥有核心决策/创作所在的工作流程?
枢纽位置可以围绕其他工作流需要插入的工作流组件构建,因为它们位于此核心决策/创建“瓶颈”的上游或下游,并为其提供信息或从中获取信息。
由此,决策中心建立了卓越的整合价值和交叉销售(甚至可能捆绑交叉补贴)上游和下游活动及其支持工具的权利。
决策中心通常具有参与的首要地位,因为它们拥有最重要的决策权。同样,创造中心也具有参与的首要地位,因为它们拥有创造过程中最重要的部分。
由于这种工作流程优势,枢纽位置越来越多地吸收并与相邻的工作流程提供商无缝集成。
让我们以 Autodesk 为例。(注意:这纯粹是说明性的,并不代表他们在 Gen AI 方面是成功还是失败)
在建筑行业,Autodesk 在建筑的设计-规划-建造-运营生命周期中占据着这样的地位。Autodesk 在生命周期的设计阶段具有优势,并可以利用该工作流程优势充当生命周期中心。
通过第二个优势来源,这一地位可以得到进一步加强。
关键优势2:情报优势
您是否拥有专有模型,能够支持独特的关键(部分或全部)核心决策和/或创造性活动?
枢纽地位是围绕某些专有模型优势建立起来的。
这通常涉及通过访问与核心决策或核心创造性行动相关的专有数据流来专有地微调模型的能力。
这反过来又形成了一个正反馈循环。
随着枢纽位置的建立,来自其他工具的其他数据流开始与其集成(特别是如果该位置还具有工作流和/或关系优势)。随着更多数据流的加入,枢纽位置的情报优势得到改善,其对核心决策或核心创意行动的控制点也变得越来越强。
仍以 Autodesk 为例,Autodesk 收购了运营整个建筑生命周期的公司(以创建 Autodesk Construction Cloud),从而提供了跨生命周期数据集的访问权,除了工作流优势之外,还通过构建智能优势进一步提高了其对枢纽地位的争夺。
关键优势3:关系优势
您是否与决策者和/或创造者具有首要关系?
拥有核心用户关系(核心决策者或核心创造者)是关键。对于企业软件来说尤其如此,因为在职人员与核心用户(不一定是客户,而是拥有核心决策权或公司价值链中核心创造行动的用户——例如放射科医生)的关系将是关键。
如果现有企业具有关系优势,那么具有工作流程和/或情报优势的新兴企业仍可能遇到障碍,并可能最终不得不与现有企业合作。
以我们的 Autodesk 示例为例,Autodesk 与关键创造者(设计阶段的建筑设计师)建立了关系,并且与关键决策者(规划阶段的建筑规划人员)建立了关系(虽然关系较小,但仍然很重要)。
结合这三大竞争优势——工作流、智能和关系——可能使其很好地成为建筑领域的人工智能中心。
谁赢得枢纽地位?
让我们看几个场景,看看当初创企业和现有企业争夺人工智能领导地位时,这种情况会如何发展。
场景 1:新创企业凭借工作流程 + 情报优势 VS 现有企业凭借关系优势
如果现有企业仅拥有客户访问权,那么现有企业可能没有足够的优势来取胜。在这种情况下,新企业可能更有能力取代现有企业。
场景 2:新贵拥有智力优势 VS 现任者拥有关系优势
这是一个非常有趣且可能出现的情况,然而大多数初创公司却没有采取行动。
正确的战略举措取决于现有企业的市场结构。
- 如果市场被一家现有企业主导,那么新贵企业应该寻求与现有企业建立深度合作伙伴关系(独家/合资)。
- 如果现有市场分散在多个参与者之间,那么初创公司更适合向多个现有参与者提供模型即服务,并且通过嵌入为客户服务的现有参与者中来寻求潜在的情报优势。
场景 3:具有关系优势的现有企业建立/购买情报和/或工作流程优势
这是最有力的既有举措。缺乏模型和/或用户体验能力的既有企业将会等待这样的机会。