DeepSeek持续引发关注,很多国内外企业都陆续披露其产品或者解决方案已接入DeepSeek。
所以,有些老板也会发出问题,如何基于DeepSeek开展AI项目?
抛开一些偏细节、偏敏感的内容,在这里分享有一套可落地的方法论。
第一,也是最重要一点:目标是什么?
AI产品的目标是什么?
开工第一天几乎所有的老板都在讨论AI、讨论DeepSeek。并有多个CEO表示:后续业务开展,全面拥抱AI,并期待实现行业应用的领先!这个味道很熟悉,感觉又回到了两年前ChatGPT刚诞生的情况,很多公司出于焦虑或者想要抢占行业注意力,都做好了准备 All In AI,但这里我要泼一点冷水:你的急迫可能导致巨大损失!
一、DeepSeek并没有领先于GPT
首先,所有人必须认识到一个事实:虽然DeepSeek非常优秀,但他并没有领先于GPT!
换句话说,之前各位可以根据GPT的API调用完成的功能,如果基座模型换成DeepSeek后,他的表现可能还会差点。
DeepSeek真正的价值在于两点:
第一、合规性,他是国内的开源模型,并且能力优秀,可以为医疗、金融等相对敏感的行业松绑,他们有更优的基座模型选择了。
而由于基座模型的进化可能带来的价值是:实现路径的大幅成本降低!这可以节约不少钱。
第二、可以私有化部署,并且训练的成本极低!
常规的AI产品基础技术架构事实上只有两条:API、API+知识图谱。
之前多数人认为预训练+微调是错误的技术选择,其核心是高昂的成本。
现在基于DeepSeek的微调貌似成本也不高,这会导致新的技术路径产生,而API、API+知识图谱、基于微调的AI产品三者之间差异是什么,到底如何选择,很多人是模糊的。
二、可以兴奋但别焦虑
老板们逐渐相信AI会重塑所有,于是他们会想用AI的方式将公司产品重塑一次。
这会引发第一轮的焦虑,因为没有可以抄的对象,多数人是不知道怎么做的!所以很多公司现在是既迷茫又兴奋:
兴奋的点在于,行业洗牌的机会来了,抓住了就是下一个头部;
迷茫的点在于,那是真的不知道该怎么做;
首先是AI对于自己的产品意义是什么,比如是产品用上AI的能力,还是用AI能力去重塑产品,不清楚;
其次是AI能力的边界在哪里,比如数据对于大模型幻觉的意义是什么,是否要投入大量资源去整理数据,不敢赌;
然后是具体的技术路径是什么,比如是API还是微调,不明白;
其实这里有个判断依据:在DeepSeek出现前,GPT的表现已经足够优秀,如果你们公司在之前没出太多创新,今年也很难马上做出什么。
这里的原因是AI产品的非对称性。
三、非对称性
无论是GPT还是DeepSeek,他们都太强大了,基于他们做出来的AI产品容易让我们产生一个幻觉:我们公司的AI太强大了!
醒醒吧,这是幻觉!AI很容易产出一个demo,但很难得到一个应用!
大白话是:业务判断AI产品能不能用的标志是能不能完全接管业务,如果不能就是玩具!
对于AI应用,你可以用一周时间完成一个demo;
但半年后,实现的产品效果依旧不能超越这个demo!
这里非对称性也就出来了,花费10%的资源可以得到一个70分的demo;想要将70分推到90分,可能你需要1000%的资源!
入门简单,精通难!大模型是很容易造成老板/产品/技术错误判断的存在,如果轻易承诺,肯定会坑了自己。
所以,想要AI在应用上表现出色,必须要有耐性!
四、耐心很重要
做AI项目,耐心是很重要的,简单来说:你认为Prompt提示词困难吗?
Prompt不是有手就行嘛,谁会中文还不会写点提示词,但Prompt其实很难:
- 首先,写出稳定输出的Prompt很难;
- 其次,在不同场景中Prompt要稳定输出更难;
- 最后,要与优质数据配合并且要稳定输出的Prompt很难;
这对我们的启示是什么呢?这对我们的要求是有耐心、有定力,不要因为今天产品表现得好而过分开心,也不要因为明天产品表现的弱智而过分焦虑。
保持平常心,去面对、去调整,因为提示词调优只是AI产品过程中最简单的部分,寻找正确的路径,试验正确的路径,才是其中的难点…
对于一般公司,AI项目的成败取决于技术团队工程能力的强弱,以及对相关领域的认知!
所以好的程序员跨界去深入学习某行业知识,再转做产品经理会变得十分吃香。
其次,在基座模型能力上来后,大家都是在70分水准的基线上竞争,如何通过自身的优势快速达到90分会成为占领高地的关键。
有了以上认知后,我们会达成一个共识:我们离成熟的AI应用诞生还有一段时间(1-2年),而就算已经有爆款产品出现,也不要慌张,产品层面的进步是最容易赶上的。他不会比DeepSeek比肩GPT更难!
所以,我们最应该想清楚两个问题:
- 目标是什么;
- 目标对AI能力的要求是什么;
如果GPT的能力值是100分(大学生水平),也许你的产品其实只需要70分(初中生水平)就够了呢?
在目标清晰后,就应该坚定的执行在这个窗口期(1-2年)将配套设施打磨好,而不是急于推出产品去吸引注意力。