大模型没有未来？

最新推荐文章于 2024-05-25 22:40:09 发布

python_知世

最新推荐文章于 2024-05-25 22:40:09 发布

阅读量882

点赞数 12

文章标签：人工智能 ai 大模型

本文链接：https://blog.csdn.net/zhishi0000/article/details/138373622

版权

2023年，科技领域和创投界最火的风口，莫过于大模型！

从硅谷到中国再到全球，短短几个月的时间之中，大模型便快速在科技圈形成热潮，远超PC时代、互联网及移动互联网时代各个风口的风靡速度。

这不是人工智能的首次火爆，但上次AI引发的热潮则要追溯至2016年。

当年，谷歌AI机器人AlphaGo在“人机大战”中，首次击败人类职业围棋冠军李世石时，人类便真切感受到了可能被AI取代的危机，全球也开启AI领域“军备赛”。

在那之后，人工智能领域完整经历了从极速繁荣到资本退潮的全历程，行业也走入了数年的低谷期。

尽管这几年，行业内也不乏明星AI公司问世，但始终没有真正的爆款产品落地。于是，AI行业因此不温不火，人工智能就像空中阁楼，可触而不可及。

这次OpenAI携ChatGPT而来，大模型似乎为人工智能领域的发展指明了一条光明的道路。但ChatGPT是否会让AI行业焕发生机？AI将会拉开和书写一个怎样的时代?

吹响时代的号角

2023年初，Open AI发布的ChatGPT，迅速引发全球热议。

ChatGPT强大的自然语言理解、语言生成和语音识别等能力，使得人们与其对话就像是场跨越物种的对话。

更重要的是，ChatGPT的出现让此前缓慢前行了几十年的人工智能，首次在实用性上得到了质的飞升，也让更多普通人直观感受到了人工智能的神奇魅力。

比尔·盖茨认为，ChatGPT出现的意义不亚于私人电脑和互联网；黄仁勋将其上升到技术革命的高度看待；李开复也说AI大模型是不可错过的历史机遇；李彦宏则表示，大模型即将改变世界……

在资本追逐下，OpenAI当前估值已达900亿美金，成为全球估值最高的初创公司。同时，ChatGPT所引发的AI风潮，更是直接让AI市场再次火热。

市场预计，大模型市场规模将是移动互联网的10倍，是新的蓝海。

3月14日，OpenAI又发布了内容生成能力远超GPT-3.5的多模态大模型GPT-4，在智能化和实用性上获得了肉眼可见的提升。

在GPT4发布一个月后，创投圈氛围逐渐升至沸点，资本迅速涌入AI赛道。

在这场由ChatGPT引燃的全球AI竞赛中，国内的华为、腾讯、科大讯飞等科技大厂紧跟趋势，加速推出自己的大模型平台。

除了大厂争相布局大模型外，原本就在AI领域的科技公司同样活跃了起来，商汤科技、第四范式等公司也陆续推出了自己的大模型产品。

此外，不少个人创业者特别是互联网领域的大佬，也开始跑步进场。

其中，搜狗创始人王小川只跟ChatGPT简单聊了几轮，就确信“AGI已经来了”。随后，他便宣告创立百川智能，对标GPT-3.5大模型。

发出上述感叹后不久，王小川于4月10日正式宣布创建“百川智能”，以帮助大众轻松、普惠获得世界知识和专业服务

无独有偶，美团联合创始人王慧文早在2月初便创立光年之外，还发布“AI英雄榜”招兵买马，立志打造中国的OpenAI。

此前，在中国互联网快速发展的十余年间，业界曾经历了社交之争、百团大战、百播大战。

对此，金沙江创投管理合伙人朱啸虎朋友圈发文称，“没想到硬科技大模型创业，依旧是百模大战。”

事实上，“百模大战”已不再是种夸张的修辞，而是客观现实。相关数据显示，国内大模型数量已经达到130个，已经超出美国的114个，位居全球首位。

有趣的是，我国大模型平台的取名简直上演了现实版的“诸神之战”，大厂小厂们纷纷引经据典，从神话故事到圣贤百家，各路神仙各显神通。

例如，百度“文心一言”、阿里“通义千问”、华为“盘古”、腾讯“混元”、京东“犀言”、达观数据“曹植”……

应该说，这次科技大厂掀起的“百模大战”，既有互联网大厂在流量见顶后，想要抓住技术变革机遇的“主观原因”，也有ChatGPT这样的明星公司踩着十几年技术沉淀突然指明前进道路的“客观原因”。

并且，既往互联网史上的数次商业大战已充分表明，先发优势是成为行业领跑的重要因素，面对新的技术机遇没有企业愿意落后。

所以，“百模大战”的开局因而能如此快速，如此迅猛。

还在亏本的生意

今年8月，一篇题为“OpenAI可能会于2024年底破产”的文章引发不少关注。

文章主旨简单概括便是，OpenAI的烧钱速度太快了。文中提到，OpenAI的亏损在快速扩大，仅2022年就亏损约5.4亿美元。

据国盛证券在今年2月发布的报告中估算，GPT-3单次训练的成本约为140万美元，对于某些更大的LLM模型训练成本则介于200万美金至1200万美金之间。

据了解，大模型的成本主要来自于芯片、算力和人才，还有电力和网络等支出。随着市场需求的增大，芯片和人才的价格都开始水涨船高。

今年以来，应用于大模型训练的英伟达旗舰芯片H100和次旗舰芯片A100涨幅超过50%，而在我国AIGC岗位薪资更是上涨到年薪百万元。

行业整体在进行岗位优化的背景中，头部科技公司对AIGC类研发岗位的需求相当强劲，这从侧面说明大模型正在引发行业热潮

红杉资本曾算过一笔账：全球的科技公司每年预计将花费2000亿美金，用于大模型基础设施建设；相比之下，大模型每年最多只能产生750亿美金的收入，中间存在着至少1250亿美金的缺口。

比烧钱更为本质的问题是，大模型的落地应用和商业变现等问题。目前，大部分参数堆上天的大模型，最大的应用场景却是聊天。

尽管Chat类大模型在聊天、娱乐等通识属性较强的场景上表现颇佳，但在细分产业场景上通用大模型回答准确度却较低。

而且，随着外形雷同、功能相似的AI绘画、AI聊天机器人等AIGC应用涌入市场，人们对这些应用的新鲜感已经逐渐消散。

据第三方网站SimilarWeb监测数据显示，今年6月ChatGPT网站与移动客户端的全球流量（PV）环比下降了9.7%，美国地区的流量环比下降了10.3%。

市场的降温，也表现在投资热情的退却。据界面新闻报道，有中国人民大学教授背景的智源团队在1年时间见了150多家风投机构，却依然没有拿到投资。

《中国企业家》报道，相当部分关注大模型领域的投资人，走访对接企业多以调研和学习为主，真正出手次数屈指可数，甚至不出手。

可以说，随着同质化竞争加剧，市面上的开源模型越来越多后，便让专注于大模型领域企业的发展空间越来越少。

今年7月，Meta发布商用开源大模型Llama2后，更是给专注于大模型的创业者当头棒喝。

在今年4月OpenAI不再开源后，Llama2的重要意义在于能让更多公司基于此直接做应用开发，这比自己搭建模型的成本更低且应用场景更加个性化。

这中间还发生了件有意思的小插曲。猎豹CEO傅盛第一时间转发了Llama2的文章，并配文“这一下不知道多少公司笑醒在深夜，多少公司哭晕在厕所…”

在朋友圈下方，朱啸虎还评论道：“都笑醒吧，又可以take free ride了。”傅盛则回复：“大模型裁员浪潮不会远了。”

其实，在傅盛预言裁员浪潮前，成立18个月就成为独角兽企业的美国AI聊天机器人企业Jasper，就已经开始裁员。据悉，Jasper这次裁员的原因主要是产品缺乏差异化优势，难以与科技巨头相抗争。

在我国，今年6月在大模型领域创业4个月之后，光年之外联合创始人王慧文因健康问题离职休养的举动，或同样预示着AI领域发展并不完全是美景。

大模型注定是场烧钱的游戏，算力、数据和人才等都是门槛。并且，Jasper等公司的故事似乎也让我们看到，在大模型领域创业公司抵抗科技巨头的艰难。

从通用走向产业

虽然，ChatGPT的到来让AI赛道再次火热，令资本和项目再次聚集于此，但其依旧未从根本上解决人工智能领域落地应用和商业变现的问题。

据不完全了解，业内大部分的AI企业都不赚钱，依靠人工智能赚了大钱的企业暂时仅有英伟达。

同样，我们的AI四小龙在ChatGPT风靡之时，也过得并不顺利。

数据显示，位居AI四小龙之首的商汤科技，从2018年至今每年都处于亏损状态，截至今年7月亏损累计437.85亿元。

尽管商汤科技是AI四小龙中最先推出大模型的企业，但因其产品和技术被质疑造假，公司股价反而出现大幅下跌。

AI投入成本高、周期长、盈利难，让我国AI四小龙均陷入发展困境，究其根本主要还是商业化落地遭遇瓶颈。

目前，无论是商汤科技还是云从科技，其用户主要以to G市场为主，to C业务却明显不足。

ChatGPT看似指明了一条光明的道路，但关于大模型创业其实始终存有隐患，即随着大模型的大量开源未来应该是1-2个头部厂家赢者通吃，国内大模型终将只会有少数企业能活下来。

重复造轮子只会加剧内耗，只会浪费更多资源。因而，无论是互联网大厂，还是创业公司都开始转变思路，将大模型作为底层技术应用于各个领域，做具体产业的垂直模型。

某种程度上，“大模型”现阶段正在走向“小模型”，从“通用”迈向“产业”。

当然，产业大模型和通用大模型也并非完全对立关系，产业大模型是基于通用大模型的基础训练出来，但生成的内容更符合产业场景需求。

媒体报道显示，早在今年3月微软已将GPT-4整合进微软办公软件，开始了推进大模型的应用落地。

此外，微软后来还发布了个只有13亿参数，但具有大模型推理能力的开源小模型Orca，其在某些场景中的具体表现比GPT-4更好。

在微软和OpenAI的示范下，国内大模型平台也开始基于垂直场景试水。

例如，阿里的通义千问在链接钉钉之后，用户可以在文档中生成文字或图片、在群聊里快速总结并生成摘要和待办、在视频会议里生成核心纪要，也可以只靠一张图片实现“拍照生成应用”。

华为的盘古大模型3.0，专注于各细分行业领域，运用三维神经网络处理气象数据，使得气象预测的速度提高了10000倍以上；运用在生物医药领域，可以降低研发周期和成本等等。

京东提出“大模型的价值＝基于算法×算力×数据×产业厚度的平方”，并推出犀言大模型，基于京东自身积累的供应链数据来训练，未来将深入应用于零售、金融、物流、健康、工业等产业场景。

大模型的落地应用也给市场增加了信心，我国互联网大厂先天占有算力、资金、人才等优势，还有丰富且庞大的垂类领域数据资源，这也为未来进入更多场景、达成商业变现提供了现实可能。

大模型竞赛是世界范围的，这场竞争注定激烈、赛程注定漫长、但也注定精彩，让我们拭目以待！

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

123?spm=1001.2014.3001.5501)这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

python_知世

关注

12
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
大模型没有未来？

2023年，科技领域和创投界最火的风口，莫过于大模型！从硅谷到中国再到全球，短短几个月的时间之中，大模型便快速在科技圈形成热潮，远超PC时代、互联网及移动互联网时代各个风口的风靡速度。这不是人工智能的首次火爆，但上次AI引发的热潮则要追溯至2016年。当年，谷歌AI机器人AlphaGo在“人机大战”中，首次击败人类职业围棋冠军李世石时，人类便真切感受到了可能被AI取代的危机，全球也开启AI领域“军备赛”。在那之后，人工智能领域完整经历了从极速繁荣到资本退潮的全历程，行业也走入了数年的低谷期。
复制链接

扫一扫