AI大模型的10大趋势预判！

泡椒竹笋面

已于 2024-05-09 21:01:34 修改

阅读量832

点赞数 5

文章标签：人工智能测试工具 web安全 AIGC

于 2024-04-09 16:08:05 首次发布

本文链接：https://blog.csdn.net/kaka0722ww/article/details/137556387

版权

全球范围内，大模型竞争激烈，中国与国际大厂展开较量，同时算力需求巨大。文章预测了未来大模型发展的十个关键趋势，包括中国大模型行业格局变化、算力供应与挑战、团队人才的重要性、开源与闭源策略、以及技术与市场路径的分歧。

摘要由CSDN通过智能技术生成

大模型发展竞争愈发激烈。全球瞩目的文生视频Sora、谷歌Gemini 1.5、Meta的V-JEPA以及超越GPT4的Claude3相继发布。Open AI的GPT5也即将问世。奥特曼不仅自研芯片，还投资可控核聚变公司，以算力和能源为未来储备关键资源。

在算力紧平衡和数据资源荒的背景下，面对快速变革，笔者尝试对未来大模型的发展做出10个预判：

判断一：中国基础大模型的数量会快速收敛，卷不动了

中国大模型行业呈现“百模大战”态势，但2024年随着基础大模型如Claude3和视频大模型如Sora的能力提升，资源不足和“套壳”大模型厂商可能退出，行业将转向几家大厂和少量明星创业企业的竞争。国外则以大厂与创业公司合作为主，如微软与Open AI、谷歌与Deepmind等。芯片巨头英伟达也在2023年大举投资生成式AI项目，比2022年多6倍。但国外基础大模型领域并未出现类似的激烈竞争。

判断二：万卡是一个入门的算力

近日，Perplexity的CEO Srinivas在《Invest Like The Best》节目中透露，他曾试图从Meta聘请资深研究员，但被对方以需要1万块H100 GPU回应，反映了基础大模型训练对算力的巨大需求。GPT4和GPT5的训练分别需要2.5万张A100和5万张H100（相当于15万张A100）的算力。扎克伯格计划购买35万张H100芯片以追赶GPT5。而0pen AI创始人奥特曼计划筹集7万亿美元自研AI芯片。

在中国，2023年前三季度，英伟达中国营收推算显示，中国新购买的算力相当于58万张A100，但仍远不及Meta。受美国芯片禁令影响，中国无法补充先进算力，导致处于严重被动。国内芯片厂商如华为、海光等，受制于产能问题，供货量距离大模型训练需求尚有较大缺口。此外，国产AI芯片存在适配周期长、成本高、难度大等问题，延长了国产大模型训练周期。

判断三：大模型的能力取决于一个团队金字塔顶尖人才的认知，小团队也能涌现高智能

大模型的发展由顶尖人才推动，人才密度和强度是关键。OpenAI的三位灵魂人物——Sam Altman、Greg Brockman和首席科学家伊利亚，在7年间持续投入数十亿美元，坚持AGI信仰，成就了ChatGPT的传奇。同样备受瞩目的Claude模型公司，由OpenAI核心员工如Dario Amodei和Tom Brown创立，其成员对大模型的深刻理解是取得突破的原因。尽管只有22人，但Character.ai因其Google前员工Noam Shazeer的技术背景，成为访问量第二的聊天应用。而20多人的Mistral公司，由前DeepMind和Meta科学家创办，三位创始人均有大模型开发经验，并在基准测试中表现出色。

判断四：开源大模型难以胜过闭源

开源是软件领域的重要趋势，推动了应用生态的繁荣。然而，从GPT3开始，Open AI选择了闭源，导致开源大模型停滞在GPT3.5水平。目前，业界口碑较好的开源大模型包括Meta的LLaMA2、Mistral的Mistral 8x7B、智谱的ChatGLM-6B等。大模型的代际碾压效应导致基于GPT的小公司面临倒闭风险。

开源方式更适合做生态，但受限于算力和算法等，原有集众智的开源模式很难在基础大模型自身的快速演进上复现。

判断五：能走多远，取决于对AGI和Scaling Law的信仰

Open AI等大模型企业对AGI的信仰获得更多认同，Sora从视频理解到世界模拟器的路径、杨乐昆的世界模型构想，都是产业界迈向AGI的努力。大力出奇迹的范式被证明有效，包括Sora的成功，也再次验证了视频领域Scaling Law的有效性。Open AI以Scaling Law为核心理念，坚信规模化在模型、系统、自身、过程和雄心壮志中的魔力，鼓励在疑惑时扩大规模。

判断六：个人应用要过千万月活门槛

移动互联网时代的APP用户数量庞大，但中国AI原生APP增长相对较慢，目前头部的APP月活用户刚刚突破千万。即使在互联网圈，也有很多人没有使用过这些APP，特别是在三四线或更小的城市。根据QuestMobile报告，头部APP应用去重月活用户突破5000万，这些应用主要集中在文本和图像生成领域。其中，豆包、文心一言等应用以月千万活跃用户规模领先，其次是天工、扮伴-AI绘画及讯飞星火等应用。

相比而言，2022 年 9 月至 2023 年 8 月期间，全球排名前 50 的人工智能工具吸引了超过 240 亿次访问。ChatGPT 以 140 亿次访问量领先，占分析流量的 60% 以上。

判断七：手机端侧大模型将加剧和超级APP的入口之争

大模型正逐渐转向端侧，使得AI推理能够在手机、PC、耳机、音箱、XR、汽车等新型终端上运行。端侧大模型具有优势，如本地数据处理效率高、节省云端成本、增强用户数据隐私保护，以及开启新的交互方式。未来，结合向量化后的个人数据，端侧大模型将提升手机交互流畅性，实现更多原生操作和功能。多家企业已推出端侧大模型，如小米的MiLM、VIVO的蓝心等。此外，高通和苹果等芯片厂商也在积极支持端侧推理。然而，端侧大模型可能成为新的手机交互入口，可能导致APP被边缘化，加剧手机企业在生态内的话语权。

判断八：效率、体验、创造是当前大模型落地三大核心价值

效率是大模型推动自动化的核心逻辑。体验和创造则是其落地的特别驱动力。交互更加友好，机器逐渐适应人，理解指令、语言甚至情感。

创造是生成式大模型的核心能力，已被广泛应用于文字、图片创作、传媒影视、广告、短视频和游戏等领域。模型幻觉问题也可能通过创造的方式激发更多灵感。在AI4S领域，创造提供了更大的想象空间，AI科学家有望在未来取得更多突破。例如，DeepMind开发的深度学习工具在17天内合成了41个拟定化合物，成功率达71%，每天平均产出2个以上新化合物。

判断九：未来可能出现更多的一人企业

大模型与AI Agent的进步，为个人提供了更多智能工具支持。未来，个人可能拥有多个助理，从而加大了对个人领导力和判断力的要求。一人企业的趋势也在改变大企业的组织方式，组织内个人的角色变得更为多元，如身兼数职。同时，数字员工成为企业核心竞争力之一，其数量和质量至关重要。

判断十：“技术派”VS“变现派”的争论在3年内会有定论

最近，“小珺访谈录”的两篇文章对杨植麟和朱啸虎的观点进行了比较，表明中国科技界对大模型的态度存在分歧。一方是技术信仰派，主张像OpenAI一样追求AGI和scaling law，认为模型能力提升和成本降低将解锁更多应用。另一方是市场信仰派，认为应将足够的AI能力投入能快速变现的商业场景中，利用中国市场的独特数据建立优势。这种分歧反映了长期主义和实用主义的争论。

OpenAI的成功为长期主义提供了激励，预计到2026年将迎来GPT6等更强模型，具有商业价值。然而，降低幻觉率仍是技术挑战，未来大模型可能提供置信度概率，以区分参考和确定性判断。

综上，基于scaling law，未来模型的规模无可想象**，**大模型之路的尽头是算力，更是电力。

大模型岗位需求

大模型时代，企业对人才的需求变了，AIGC相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。
在这里插入图片描述

掌握大模型技术你还能拥有更多可能性：

• 成为一名全栈大模型工程师，包括Prompt，LangChain，LoRA等技术开发、运营、产品等方向全栈工程；

• 能够拥有模型二次训练和微调能力，带领大家完成智能对话、文生图等热门应用；

• 薪资上浮10%-20%，覆盖更多高薪岗位，这是一个高需求、高待遇的热门方向和领域；

• 更优质的项目可以为未来创新创业提供基石。

可能大家都想学习AI大模型技术，也想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。为了让大家少走弯路，少碰壁，这里我直接把全套AI技术和大模型入门资料、操作变现玩法都打包整理好，希望能够真正帮助到大家。

-END-

👉AI大模型学习路线汇总👈

大模型学习路线图，整体分为7个大的阶段：（全套教程文末领取哈）

第一阶段： 从大模型系统设计入手，讲解大模型的主要方法；

第二阶段： 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段： 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段： 大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段： 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段： 以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段： 以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。
在这里插入图片描述

👉学会后的收获：👈

• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求： 大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能， 学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力： 大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

👉获取方式：

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

泡椒竹笋面

关注

5
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
AI大模型的10大趋势预判！

大模型发展竞争愈发激烈。全球瞩目的文生视频Sora、谷歌Gemini 1.5、Meta的V-JEPA以及超越GPT4的Claude3相继发布。Open AI的GPT5也即将问世。奥特曼不仅自研芯片，还投资可控核聚变公司，以算力和能源为未来储备关键资源。
复制链接

扫一扫