节目背景信息
随着大语言模型变得指数级地更好,我们可以看到,垂直领域的AI Agent 将会是下一代价值十亿美元 SaaS 公司的关键。
在这期节目中,主持人与YC校友、Casetext 联合创始人兼 CEO Jake Heller 探讨了如何打造一家成功的垂直领域 AI公司,以及如何在这个过程中打破资深行业专家和围观者的质疑的故事。
在最初的 10 年里,作为一家法律科技公司,Casetext 从 0 发展到 1 亿美元的估值,而在 GPT-4 发布后的短短两个月内,公司估值达到了 6.5 亿美元,被 Thomson Reuters 收购。
Jake 是这一场生成式 AI 浪潮的先行者,同时在实战过程中积累了丰富的如何让 LLM 在垂直领域产生价值的经验,这次访谈他分享了很多自己在这个过程中的故事。
附完整版视频:
视频来自:https://www.youtube.com/watch?v=eBVi_sLaYsc
你可以收获的 3 个 take-away
1.垂直 AI 产品不仅仅是“GPT 套壳”,产品背后的工程问题、创始人对业务逻辑的理解、团队的独家数据等都可以成为产品的竞争壁垒。
2.作为创始人,如果要让团队相信你要转型的新方向,最好自己亲自下场做出一个惊艳的 Demo,用实际效果来打动大家。
3.经过测试,OpenAI 的 o1 模型能有效提高模型输出的准确率,这给不少垂直产品带来了很多新的机会。
因为感受到了 GPT 4 的强大而快速转换了业务方向
Casetext 的团队在很早的时候就与不同的研究实验室建立了密切的合作关系,这些研究实验室包括 OpenAI,所以他们很早就能够体验 GPT 4。
当时,OpenAI 和 Casetext 的团队签署了保密协议后,就把 GPT 4 开放给了他们,在 Casetext 团队体验了 48 小时以后,团队因 GPT 4 强大的性能而感到震撼,立即转变了业务方向,将 100% 的精力投入到了一款名为“CoCounsel” 的、基于 GPT 4 的新产品上。
为什么会开始做 Casetext这款产品?
Casetext 的创始人 Jake 自己曾经是一名律师,在他刚刚成为律师的那几年,法律行业的数字化程度非常低,为案件找参考资料的过程异常痛苦。
比如,你得阅读一些大公司公司中的所有电子邮件,看是否有潜在的欺诈行为;而如果你想找到对应的法律条文,你真的得去图书馆,翻开一本一本书,在阅读中查找你需要的信息……
后来,虽然有了网页和一些研究工具被开发出来,但它们非常笨拙,搜索效率仍然很低。
Jake 是一个有计算机背景的人,他很受不了这样的工作方式,所以他自己在律所工作时,会经常根据自己的业务痛点,开发一些像浏览器插件这样的小工具。
不过律所的人不太认可这种做法,律所的总顾问常常来质问 Jake 为什么要花费那么多时间在技术上,经常和 Jake 发生冲突。
当 Jake 为自己开发出了业务工具时,总顾问也会警告他说这些技术的归属权是律所,这让 Jake 很不满。
于是 Jake 出来创立了一家法律科技公司,公司从早期阶段开始,一直以来的使命就是将最好的技术带入法律领域。
Casetext 团队的 PMF 之路
在一开始,Jake 和他的团队试图做一个律师 UGC 平台,一个像维基百科、GitHub、Stack Overflow 那样的问答社区,来帮助律师之间互相帮助。
但是这个想法失败了,因为律师通常是按小时计费的,他们的时间非常宝贵,于是没有人愿意花大量的时间在这个平台上创作内容。
后来,Jake 将大量的时间和精力投入到了 AI 上,AI 能帮助律师们发现几个案例之间的相关性,从而更高效地获取信息。
律师只用上传和自己正在处理的工作相关的文件,AI 会读取这些内容,并且推荐相似的法律案例,从而给律师参考,让律师更加清楚自己手上的案子该如何处理。
这次转型是有价值的,但是只是简单改善了律师的工作流,只能算是个不错的渐进式创新,但依然没有在行业里掀起大的波澜。
Jake 的团队在推销产品时,常常会得到律师们这样的反馈:“我一年赚 500 万美元,我的工作是按照小时计费的,不想引入任何可能让我的生活变得更高效的东西,这些东西会增加我的学习成本,同时降低我的报价,所以我并不想改变我的工作方式。”
但后来,ChatGPT 出现了,突然之间,美国甚至全球的每个律师都意识到,AI 会对他们的工作产生巨大的影响,于是 Jake 的团队接到了大量的业务咨询,很多人和他们说,“我知道你们在做法律相关的 AI 产品,我感觉我们会需要这样的产品,你可以给我讲讲你们的产品吗?”
团队也很快拥有了很高的知名度,许多投资人邀请他们去高档餐厅吃饭,许多知名的杂志刊登了他们团队的案例,他们一下子因为做 AI 做得比较早而成为了明星团队。
由于在 GPT 4 发布前就开始准备 CoCounsel 这款法律 AI 产品,他们在那时候就已经建立起了产品和技术上的优势。
CoCounsel 在那时的产品形态是一个对话式的法律 AI 产品,你可以像与 ChatGPT 交流一样和他对话,并给它布置任务,比如可以让它帮你阅读 100 万份文件,看看里面是否有某家公司欺诈的证据,然后整理出一份摘要。当时,这样的产品交互方式很像给团队招了一个新的员工,而不是购买了新的产品,这极大地提高了他们的客户所在的律师事务所的人效,所以产品很快完成了 PMF。
如何践行“Founder Mode”,带领团队进行业务转型?
对于 Casetext 来说,一开始向 AI 转型是一个不小的挑战,作为一家经营了十年的企业,他们靠着之前的产品已经能够有 1000 万 到 2000 万美元的 ARR 了,并且还能保持 70% ~ 80% 的年增长率,所以并不是每个人都会那么热情地拥抱新方向。
作为“Fonder Mode”的践行者,为了让大家感受到新方向的价值,Jake 亲手写代码,做出了 CoCounsel 的第一个版本。
Jake 在一次高管会议上向高管、员工和部分客户演示了 CoCounsel 的产品功能,这次演示非常成功,在场的所有人都被这个新产品惊艳到了,从而认可了 Jake 对转型的看法。
开发 AI 产品的独特流程:测试驱动开发
在模型能力不够强时(比如大家只能用 GPT 3.5 时),Jake 的团队花了大量的时间在研究如何让模型的输出达到可用的程度。
虽然对于一个没有用过 ChatGPT 的人来说,对话式机器人的输出很惊艳,但是在面对专业人士时,ChatGPT 的输出虽然很有律师的风格,但是细看内容的话,会发现它还是在一本正经地胡说八道,会存在不少错误,这在法律领域是绝对不被允许的。
为了让它的输出能达到可以给用户交付的标准,这里面需要进行大量的“工作流拆解”、“分节点调优”的工作。
在这个过程中,团队发现了最高效的开发方式是“测试驱动开发”,即先测试出什么样的提示词和对话流程能够让 GPT 输出有用的内容,再围绕着这个流程开发产品功能。
在这样的流程里,如何为提示词添加示例、如何构建测试集数据很关键。
垂直 AI 产品如何构建竞争壁垒?
有的人会认为,这些所谓的“垂直 AI 产品”都是“GPT 套壳”,这类产品毫无壁垒。
而 Jake 根据自己的亲身经历,给出了不一样的看法:
当你真正尝试为客户解决问题,并实际完成工作时,你需要让自己的产品像一个优秀的年轻律师助理一样出色,才能让客户买单。
而为了实现这个目标,你需要拥有独家的数据集,比如法律行业的专业案例。
并且你需要解决很多软件工程的问题来让系统更稳定,更加用户友好,比如优化 OCR 功能,让它能够识别出法律文件里的手写内容和正确读取一些排版奇怪的内容。
你还需要足够了解法律行业的各种业务系统,以便于你的产品能更好地和客户原有的系统进行集成,从而降低客户的迁移成本……
这所有的一切,构成了你的垂直产品的竞争壁垒。
这个道理是通用的,因为所有的 SaaS 产品都可以看做是“SQL 套壳”,比如 Salesforce 本质上也只是将几个数据库连接了起来,并且根据用户不同的交互方式展示不同的数据,它的竞争壁垒在于产品背后的业务逻辑。
同样的,对于垂直 AI 产品来说,竞争力不必在 AI 上,也可以和 SaaS 产品一样,在于对行业和业务逻辑的深刻理解。
OpenAI 的 o1 模型如何给法律 AI 产品带来了新机会?
由于法律行业是一个对 AI 输出的准确性要求很高的行业,所以 Jake 的团队花了大量的时间在降低模型的输出幻觉上。他们试了很多方法,比如在提示词工程里添加足够专业的用例、优化搜索算法(把一次查询拆解成多轮查询)等。
OpenAI 发布了 o1 模型之后,他们对这个新模型做了很多详细的研究。
o1 是一个具有“慢思考”能力的模型,它不会像之前的 LLM 一样根据你的问题直接输出,而是会一步步拆解步骤,好好想想之后才回答你,所以 Jake 意识到,o1 模型在输出答案之前,可能自己会多做几轮检查。
团队给 o1 提供了真实的法律简报,并且悄悄修改了里面的一些细节,使这份简报变成一个有问题、不规范的法律简报,并让 o1 模型来判断这份简报里存在什么样的错误。
他们拿了好几个模型来做测试,其它的模型都回答说这份材料没问题,唯有 o1 在进行了复杂的思考之后,找到了这份简报里出现的问题。
这让他们感受到了思维链的强大之处,他们也开始了对思维链的探索,比如邀请全国最优秀的律师来分享自己解决复杂法律问题时的思考过程和工作流程,来获得更多这方面的训练数据。
Jake 对法律行业的 AI 落地非常乐观,他认为,从此以后,你不必再像他刚入行那样,花费大量的时间和金钱在一个地下室逐页阅读文档,而是真的有个 Agent 能和你一起进行战略性的智能思考,这不仅会让工作变得高效,也会让工作更有意思。
end
往期回顾
[
40倍ROI的“迷你并购”,买来的AI SEO工具如何创造36万美金ARR?|创业第六感
2024-10-27
](https://mp.weixin.qq.com/s?__biz=MzI0NTAwMzU1MA==&mid=2247498506&idx=1&sn=83f4465ba89dd384da029b65a48e4ef7&chksm=e9579f7bde20166d27ee21bd3dca3bd780e527b145661ce877f68befbd1d603bfcf0f8f125b8&scene=21#wechat_redirect)
[
奇绩创坛孵化产品喜登榜首!AI自动化、剪视频、搞营销多面开花|Product Hunt精选
2024-10-24
](https://mp.weixin.qq.com/s?__biz=MzI0NTAwMzU1MA==&mid=2247498461&idx=1&sn=d9dd4b2b2b2d175fb98e38d2559cf6d9&chksm=e9579eacde2017bafcc7bc600ee46a727faf75c263b12eb67af5f31e335715f9ec4de47c9298&scene=21#wechat_redirect)
[
不做全球化?SHEIN董事长复盘了“出海”的成功之道
2024-10-22
](https://mp.weixin.qq.com/s?__biz=MzI0NTAwMzU1MA==&mid=2247498390&idx=1&sn=16fe8df9e5dcbbe9632b78aa5d6c2603&chksm=e9579ee7de2017f15dc467b68a4bafd6bfd8c4a368107616449f0f8708734b873ca064265dca&scene=21#wechat_redirect)
[
一个人兼职、年入25万美元的link-in-bio产品有什么秘密?| 创业第六感
2024-10-20
](https://mp.weixin.qq.com/s?__biz=MzI0NTAwMzU1MA==&mid=2247498357&idx=1&sn=35b0c592557a0b8f74f35f599cf27e9f&chksm=e9579e04de201712d455324879cd6aa0425f0267915e3488e2f939b9f61bcd5e36c0d1d5b706&scene=21#wechat_redirect)
[
NotebookLM为什么能够脱颖而出?
2024-10-15
](https://mp.weixin.qq.com/s?__biz=MzI0NTAwMzU1MA==&mid=2247498332&idx=1&sn=1c487a578341fc89a2ad1396ba5ea5cf&chksm=e9579e2dde20173bca15700f601535283c95b90a516fb92b17fba56aa917da76b19db875d3ee&scene=21#wechat_redirect)
2个月8万美元,网页设计工作室转型“服务产品化”|创业第六感
如何学习AI大模型 ?
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓
CSDN粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】
读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
👉1.大模型入门学习思维导图👈
要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。
对于从来没有接触过AI大模型的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。(全套教程文末领取哈)
👉2.AGI大模型配套视频👈
很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。
👉3.大模型实际应用报告合集👈
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(全套教程文末领取哈)
👉4.大模型落地应用案例PPT👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。(全套教程文末领取哈)
👉5.大模型经典学习电子书👈
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。(全套教程文末领取哈)
👉6.大模型面试题&答案👈
截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。(全套教程文末领取哈)
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习
CSDN粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】
读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈