国产大模型市场遇冷:挑战与机遇并存,一般人学大模型,我劝你算了吧

前阵子,大模型赛道非常热闹,360、字节、KIMI、知乎等公司纷纷召开发布会,推出自己独具特色的新产品,一时间引发市场的不少想象和讨论。在看似百花齐放、万紫千红的同时,K哥也观察到了一些不好的迹象,这些“迹象”如果不受到重视,或者不被好好解决,甚至有可能对整个行业的发展带来很大的不利影响。今天就跟大家分享一些K哥的个人看法。

01

搞浏览器的做AI,搞AI的做浏览器

最近,KIMI悄悄推出了浏览器插件,将其在AI上的深厚功力赋能到了这一插件上,主打一个“随时提问”和“快速总结”。据不少用户反馈,KIMI的这款浏览器插件,确实给他们带来了不错的使用体验。这让K哥想起了年初360公司推出的AI搜索。这款被360定位为“新一代答案引擎”的AI工具,在帮助360“破圈”AI的同时,也吸引了更多新用户,赢得不少好口碑。搞浏览器的做起了AI,搞AI的玩起了浏览器!为什么大家都不按牌理出牌,纷纷玩起了跨界?不是这个世界太疯狂,而是大家心中的“欲望”太膨胀。

360之所以跨界,是因为360公司深耕互联网多年,拥有海量的用户数据。通过AI技术,360不仅可以更深入地挖掘这些数据的价值,还能够与原有的安全业务形成互补,增强用户体验。而且,360还可以从更高的战略角度出发,以此在未来的AI战局中布点卡位。

而KIMI作为AI领域的独角兽,为啥插手浏览器?原因同样很简单,KIMI是想通过浏览器插件的方式落地AI应用,让KIMI快速触达大量用户,在短时间内积累用户数据和反馈,在将AI功能与用户的网络行为紧密结合的同时,帮助KIMI构建更加完善的业务生态,进一步拓展其在内容推荐、智能搜索等领域的应用。

道理都是明摆着的,无外乎用户、数据、业务闭环一类的商业因素。在商言商,这样的逻辑并没错,但K哥想说的是,各路玩家在考虑自身利益的同时,也要适当考虑整个行业生态的构建。如果企业过分“执着”于在所有领域都能自成一体,把所有用户都圈定锁死,不给别人“插手染指”的机会,最后可能适得其反,既分散了自身资源,又陷入创新不足的困境。

当年,微软就曾试图打造一个能够一手遮天的封闭生态系统,将 Windows 操作系统、Office 软件、浏览器等产品捆绑在一起,试图控制用户的所有网络行为,不给任何对手留下见缝插针的机会。然而,随着互联网的快速发展,微软的封闭策略还是没能成功,最终被更加开放、更有创新能力的 Google 和苹果所超越。

跨界破圈并非易事,需要付出巨大的成本和精力;人造闭环也并非长久之计,还容易陷入“内卷”的泥潭。K哥认为,也许专注、开放才是这个时代应有的王道。当前AI生态中的各个“节点”,应该更多地专注于自身的核心技术,并将其开放给更多开发者和用户,这样才能形成更良性的循环和更健康的发展。

02

把AI当搜索引擎用

李开复曾在接受腾讯科技采访时表示,很多用户在把AI当成“搜索引擎”用,是不对的。一方面,如果让AI回答天气、地名等常规问题,它未必会比传统的搜索引擎更好,而且还可能出现“幻觉”错误;另一方面,AI很多强大的功能不被开发,而仅仅被视作搜索引擎,是一种严重的“大材小用”。

之所以出现上述现象,一个重要原因是大众对AI的认知存在很大局限性。就像当大家看到AI的使用页面“很像”常见的搜索引擎,就自然而然地把它当成了搜索工具。而没有深入了解AI不仅仅是某一形态的工具,更是一种能够模拟人类智能的技术,具有超强的学习和适应的能力,其背后蕴藏着无限的应用潜力。

当然,大众对AI除了有认知层面的问题,还存在“使用能力”方面的问题,比如用户提问的能力,AI时代,一个人提问的能力(prompt engineering),甚至远比给出答案的能力更重要。这种能力,同样是时代发展、市场教育中所不可或缺的重要一环。

另外,对于AI,大家还要做好正确合理的“期望管理”。不应将AI过去神化,认为它无所不能、给出的答案都是准确的。而是应该清醒地认识到,AI仍在发展、进化的过程中,虽然可以成为我们工作生活中的有效辅助和帮手,但仍然存在很多缺陷和不足,既不能完全替代人类的思考,也远不能满足大众的全面需求。正确的认知、利用这一技术,才会让我们更客观地对待各种AI工具,把它们放在合适的位置上,既不大材小用、浪费资源,也不盲目迷信,失去应有的判断。

03

拿用户数据,训练自家的模型

数据资产被认为是AI时代最重要的资产,但随着生成式AI的快速发展,互联网上的那些普通数据已经快被翻个底朝天了,以至于新鲜、有价值的数据越来越稀缺,因此某些平台开始盯上了自家用户生成的内容。

最近,马斯克旗下的xAI公司正经历这样的风波。社交平台X的用户发现,他们在该平台上发的帖子,正在被平台拿来训练它的聊天机器人Grok 。在此之前,X平台没有发布任何正式公告或通知,就偷偷上线了一个默认用户允许将其帖子用于AI训练的不公平协议。更能证明X“阴险”的是,这一条款的入口隐藏极深,而且即使找到,手机端也无法关掉,必须用电脑版才行。

类似的事件并不是孤例,比如,近期番茄小说通知平台作者,签“同意将其作品投喂AI”的条款;Meta公司强迫用户同意将个人数据用于AI训练,否则就禁止使用其旗下的Facebook 和Instagram等产品,等等。K哥认为,这样的事件如果没有合适的处置模式,很可能会影响AI下一步的发展。

首先,这种行为侵犯隐私,违背法律法规。许多国家和地区都已经制定了严格的数据保护法规,要求企业在处理个人数据时必须获得用户的明确同意。违反规定不仅会导致企业面临巨额罚款,也会损害企业的声誉和形象。

其次,从商业角度来看,用户信任是企业最宝贵的资产。一旦用户对企业的数据处理方式产生怀疑,他们可能会选择不再使用该企业的产品或服务,甚至可能引发大众对整个AI行业的信任危机。

另外,从技术发展的角度来看,依赖未经同意的数据,可能会因为数据收集过程不透明,或用户有意无意提供一些误导性信息,从而导致模型的泛化能力出现问题,影响模型的可靠性和准确性。

04

不重视底层大模型的研发

自ChatGPT引发生成式AI热潮,席卷全球以来,中美两国无疑成了站在潮头浪尖上的领导者。但在发展路径上,我们和美国却做出了不同的选择。以OpenAI、谷歌、Meta为代表的美国同行,持续在底层大模型上发力。而我们的业界却认为:中国发展大模型不能跟美国“打篮球赛”,随着他们“满场乱飞”,而应当使用“下围棋”的方法,在技术相对落后的情况下,通过大模型赋能各个产业领域,以实现AI在应用上的突破和提升。红衣教主周鸿祎就曾大声疾呼:不要迷信底层大模型,不要学硅谷。事实上我们也确实没有学硅谷,而是开始了侧重于场景应用的行业大模型的探索之路。有数据统计,截至今年5月,国内市场已先后推出300多个大模型。技术路线上也衍生出了CoE 、MoE等不同的“流派”。

大家都明白,新时代下的AI竞争,注定是一场旷日持久的马拉松,作为其中的参与者,必然要面临“生存,还是伟大”的选择。做底层大模型研发,无疑是“伟大”但又门槛极高的事。拿OpenAI来说,为了搞研发,它每年的亏损竟高达50亿,这显然是一般的AI玩家所承受不起的。所以国内的很多AI企业,才会选择以应用作为进场的切入点,并时时刻刻、心心念念惦记着“商业化”和“变现模式”。

单纯从商业的角度看,这样做并没什么不对,但我们也不能忘记另外一个客观现实:我们很多的行业大模型、各种AI应用,其实是在底层大模型的基础上,在开源技术普及、各种预训练技术和框架工具等壁垒被打破后的前提下构建起来的。相较之下,需要耗费巨大算力资源和多样化的数据支持、深厚的技术支撑的底层大模型研发,才更具创新性和核心竞争力。举个例子,一个投入大量成本、基于GPT-4研发的医疗或金融行业的应用,可能会随着GPT-5或更高级迭代的出现,变得笨拙不堪甚至毫无使用价值。底层大模型的每次迭代,都可以将花费大量心血的各种“上层工具”,摧枯拉朽般毁灭,而这可能也是Open AI、Meta等巨头即使年年巨亏,也要狂砸底层大模型的深层原因。

比尔.盖茨有一句名言:“我们总是高估在一年或者两年中能够做到的,而低估五年或十年中能够做到的。”这句话放在大模型研发上非常合适,掌握了底层大模型,才真正掌握了主动权。近日,Meta发布被称为“世界上功能最强大的公开基础模型”Llama 3.1 405B,也说明底层大模型的竞赛,远远没有结束,我们依然任重道远。

05

开源 or 闭源,根本不是关键

李彦宏在某次访谈中大谈开源大模型、闭源模型的差别,并直言“开源大模型是智商税”。为此傅盛还进行了隔空反驳,认为开源和闭源模型是相互竞争、共同发展的关系,不应一方压倒另一方,还说闭源大模型才是真正的“智商税”。两位大佬的口水战,引起不少媒体和网友的讨论。在K哥看来,开源闭源并不重要,底层大模型研发结合应用场景拓展,才是AI发展之路的关键。

如同K哥上面所说,底层大模型是AI技术发展的基石,它在某种程度上决定了AI发展的方向和各种可能性,同时也为AI应用提供了强大的计算能力和算法支持,使得各种智能应用成为可能。而应用场景则是AI技术落地的关键所在,将底层大模型的技术与特定行业的专业知识和数据相结合,可以解决金融、医疗、教育等特定领域的复杂问题和挑战,更好地提高企业资源分配和利用效率,实现真正意义上的“AI生产力”和实实在在的降本增效。我们的业内人士,应该少一些“本位主义”的口水之争,多一些务实和专注,才是AI发展所真正需要的。大家先齐心协力、共襄盛举,一起让行业枝繁叶茂,把蛋糕真正做大,然后“一荣俱荣”不也挺好吗?

阿里云创始人王坚曾说过:“人工智能有一个非常长的过去,但是有一个非常短的历史。长到什么时候呢?长到其实你可以追溯到一百多年以前。但是短到什么时候呢?短到就是 GPT 的出来。”无论来时路是长是短,是顺畅还是艰辛,如今的AI和大模型都在快速发展的路上,希望它们的未来之路能顺顺利利,一路繁花。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值