都在讲大模型多么神奇，让更多人用得起才能真正落地-CSDN博客

本文链接：https://blog.csdn.net/qingkahui24689/article/details/140080072

自2023年开始，全球范围掀起了以大模型为代表的生成式AI浪潮。

过去一年，但凡和算力、算法、数据、网络安全、云计算、AI相关的企业和题材，都在AI大模型题材的风口上，被追捧上了天。但从技术革新的角度看，国产大模型并没有给生产生活方式带来质的改变。

前不久，李开复在一场采访中直言不讳地指出，对于美国人来说，“ChatGPT时刻”发生在17个月前，但中国用户却还在翘首以待属于自己的“AI时刻”。‍

归根结底，国内的聊天机器人和工具做得还不够好。“中国必须拥有自己的ChatGPT，才能激发公众对AI技术的极大兴趣，并推动其在更广泛领域的应用和投资。”李开复直言。

图源：pexels

与此同时，不断有大佬高喊“不能落地的大模型没有意义”。

比如李彦宏就公开表示，中国现在数百个基础模型是对社会资源巨大的浪费，更多的资源应该如何探索与各行各业的结合，以及下一个超级应用的可能性。

在需求端，市场其实非常迫切想要找到能快速落地、产生效益的AI产品和服务。对于大模型开发者和应用者来说，卷参数已经没有任何意义。

多位行业人士判断，今年将是中国生成式AI应用的爆发元年。而当下打开市场的关键突破口，“价格”成为了行业的新共识。

【一一AGI大模型学习所有资源获取处一一】

①人工智能/大模型学习路线

②AI产品经理入门指南

③大模型方向必读书籍PDF版

④超详细海量大模型实战项目

⑤LLM大模型系统学习教程

⑥640套-AI大模型报告合集

⑦从0-1入门大模型教程视频

⑧AGI大模型技术公开课名额

一、降价，让更多人先用起来

在刚刚结束的春季功能更新会上，OpenAI宣布了其最新模型GPT-4o，不仅性能有大幅提升，价格也下调了50%。要知道，这是自2023年初以来，OpenAI进行的第4次降价。

在当前市场上，大模型通常是以1000tokens为计费单元。以GPT4为例，从去年3月发布至今，OpenAI把GPT4升级到GPT-4o，输入价格从0.03美元/1000tokens下降到0.005美元/1000tokens，降幅高达83%；输出价格也从0.06美元/1000tokens下降到0.015美元/1000tokens，降幅为75%。

按照OpenAI的预期，其大模型将按照每年50-75%幅度继续降本。

把降本深埋在业务发展主线的，不只有OpenAI。今年以来，为了加速应用端的落地，国内大模型玩家不仅开始顺应降价的趋势，甚至降幅力度达到了惊人的程度。

例如智谱大模型在本月官宣其新的价格体系，入门级产品GLM-3Turbo模型调用价格从5元／百万tokens降至1元／百万tokens，降幅高达80%。

再比如DeepSeek在5月6日发布的二代MoE大模型DeepSeek-V2，能力对标GPT-4、llama3-70B，每百万tokens的输入和输出分别是1元和2元，只有GPT-4Turbo价格的近百分之一。
在这里插入图片描述

而字节在5月15日发布的豆包大模型，直接把AI使用成本从“以分为单位”，干到了“以厘为单位”的时代。

其中，主力模型豆包Pro32k定价0.8厘/1000tokens，比行业平均价格降低99.3%。在全行业降价的背景下，同样是1块钱，用户可以从GPT买到2400个token，国产大模型可以得到8000多个token。

如果用户用开源Llama模型自己搭建，大概能获得3万个token。而1块钱，能在豆包大模型上足足获得125万个token，相当于处理3本75万字的《三国演义》文字量。

在过去一年上演的“百模大战”，每隔一段时间总会有人对“如何加速模型落地”进行追问。无可否认，AI大模型有无限大的价值，等着市场玩家去发掘，但眼下不过是行业非常初期的探索阶段。

AI作为一场成本驱动的生产力革命，大模型的价值在于通过创建图像和语言理解，让创造的边际成本无限趋近于零。

在火山引擎总裁谭待看来，降价是价值创造的重要推动力：“大模型在toB市场的应用场景还很少，包括OpenAI也在不断降价，大家的共同目标都是把市场蛋糕先做大。”只有降低客户试错成本，才能促进产业繁荣。

一位行业人士坦言，目前中国AI大模型应用的市场规模，与所有市场玩家投入的训练成本相比杯水车薪。企业还无法靠toB服务做到正循环，在收入方面的差距在两个量级以上。在这种情况下，大模型企业试图通过降价，让更多人用起来，“至少是条可以尝试的路子。”

二、提高推理效率，成本或许还能降

中国企业历来奉行应用主义，多数企业之所以愿意拥抱AI时代，是希望自身在市场竞争中借助AI打造差异化优势，从而提升行业竞争力。

然而，面对市场层出不穷的大模型，用户难以准确做出选型决策。再加上企业缺乏模型调优和专业数据处理的经验，导致模型的实际应用效果达不到预期，很难与自身业务相适配。

模型效果是AI落地最关键的一环。多位行业从业者表示，好的技术一定是在大规模应用、不断打磨的情况下形成的。

字节在豆包大模型发布会上也对外阐述——用起来才是关键。“只有在真实场景中落地，用的人越多，调用量越大，才能让模型越来越好。”谭待告诉虎嗅。

通常来说，价格是用户对于大模型的首要考虑因素。

毕竟AI创新的风险系数非常高，很多企业即使想做各种创新，可受限于模型使用成本，并且担心模型难以胜任各垂类场景的任务，导致ROI为负，因此会更倾向尝试没有门槛负担的工具。

在这里插入图片描述

图源：pexels

谭待粗略算了一笔账，企业要想用AI做一项创新，至少要消耗100亿token，如果按照大模型之前的售价，平均需要花费80万元，而现在使用豆包大模型，只需要8000元就能搞定。

过去，大模型推理成本下降，很大程度上依赖于算力的升级。而豆包之所以在价格上“碾压”其他同类大模型，依靠的是模型结构的优化、工程上从传统的单机推理变为分布式推理，以及把不同负载的推理进行混合调度等方式，从而带来超预期的降本效果，也成为打开AI应用的重要“开关”。

值得注意的是，包括BATJ等头部大厂，也都在把大模型的竞争焦点放在了模型训练效率提升，降低大模型的推理成本上。

当然，如果单纯拼价格，谁都能祭出价格更低的大模型。但如果要真正打破大模型与行业之间的高墙，让美好的场景更广泛地发生，更低的成本是必要条件，但不能以牺牲模型的质量为前提。

例如市面上也有很多轻量化模型，虽然也做到了比较低的成本，但是以压缩了模型能力和推理成本为代价，在效果上大打折扣，不能与其主力模型相提并论。

尽管大模型降价的趋势已成必然，但“行业最低价”也招致不小的热议。

一方认为，豆包大模型以行业最低价让企业用最低成本就能调用大模型，加速了应用落地；

另一方则批评，字节的野心让其过早地触发了价格战，随着各家大模型使用成本逐步降低，接下来很可能会上演一场市场争夺战。

对于外界的质疑，谭待解释称，大模型现在还是初期阶段，远没有到激烈竞争的程度，模型的推理成本未来一定会继续下降，“或许，等到那时再回看今天的0.8厘钱，也许一点都不便宜。相比之下，我们只不过是提前那么一步而已，目的并非是为了驱赶对手。”

况且，低价不等同于“价格战”。toB需要保持长期的盈利，谭待表示：“不亏损是保障业务稳定的关键，也是火山引擎的原则。”因为只有这样，才能长期可持续地提供服务。

三、“百模大战”，应用落地是关键

在去年AI大爆发引发的大模型训练热潮中，包括智谱AI、月之暗面、Minimax、零一万物最早都使用了火山引擎的算力训练模型。

云市场其实比拼的就是规模。AI大模型的火热，为云厂商开辟了新的市场机遇。微软Azure就是最有力的证明。其通过投资绑定OpenAI让云业务一路高歌猛进，跃升为全球第一的智能云。

目前，豆包大模型已通过火山引擎正式对外提供服务。根据官方数据，豆包大模型单日Tokens的用量达1200亿，单日生成的图片数超过了3000万张。

去年开始上演“百模大战”，现在除了模型的效果和成本，应用落地也非常关键。

比如，在过去一年里，豆包接入了包括抖音、头条、番茄小说等50多个业务，业务场景涵盖办公智能助手、电商导购、售后客服、营销创作、数据智能分析、编程助手等，并邀请了手机、汽车、金融、消费、互娱领域的行业头部客户内测。

在模型打磨的过程中，挑战一直都在。

首先要让基础能力和性能达到对应的标准，然后对接企业客户需要解决很多问题，比如搭建大模型评估和应用流程，包括测试集合、案例分析和精调能力等，否则很难辨别哪些场景靠谱，哪些场景短期内不合适。

也是在和企业客户磨合的过程中，大模型团队可加深对助手类、知识类、娱乐类、教育类等各行场景的了解和适配程度，在实践摸索中找到最佳的解决方案。

大模型的能力目前很多维度上让人惊叹，但也有很多缺陷，同时又在快速演进，每隔三个月、半年都会发生很大变化。

“这恰恰是做大模型产品的挑战和乐趣，需要在这种持续动态的技术发展中，不断去判断下一个产品的PMF（产品市场匹配点）可能是什么。”

值得一提的是，在字节的AI应用搭建平台“扣子”上，已经有些开发者通过自己开发的应用，获得了一定收入。谭待预测在今年下半年，大模型在应用方面将会让更多场景，从概念验证阶段走向落地阶段。

大模型将如何塑造未来，一切还要交给时间去验证。

如何系统的去学习大模型LLM ？

作为一名热心肠的互联网老兵，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的 AI大模型资料 包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴，可以V扫描下方二维码免费领取🆓

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

在这里插入图片描述

四、AI大模型商业化落地方案

阶段1：AI大模型时代的基础理解

目标：了解AI大模型的基本概念、发展历程和核心原理。
内容：
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
  - L1.4.1 知识大模型
  - L1.4.2 生产大模型
  - L1.4.3 模型工程方法论
  - L1.4.4 模型工程实践
- L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。
内容：
- L2.1 API接口
  - L2.1.1 OpenAI API接口
  - L2.1.2 Python接口接入
  - L2.1.3 BOT工具类框架
  - L2.1.4 代码示例
- L2.2 Prompt框架
  - L2.2.1 什么是Prompt
  - L2.2.2 Prompt框架应用现状
  - L2.2.3 基于GPTAS的Prompt框架
  - L2.2.4 Prompt框架与Thought
  - L2.2.5 Prompt框架与提示词
- L2.3 流水线工程
  - L2.3.1 流水线工程的概念
  - L2.3.2 流水线工程的优点
  - L2.3.3 流水线工程的应用
- L2.4 总结与展望

阶段3：AI大模型应用架构实践

目标：深入理解AI大模型的应用架构，并能够进行私有化部署。
内容：
- L3.1 Agent模型框架
  - L3.1.1 Agent模型框架的设计理念
  - L3.1.2 Agent模型框架的核心组件
  - L3.1.3 Agent模型框架的实现细节
- L3.2 MetaGPT
  - L3.2.1 MetaGPT的基本概念
  - L3.2.2 MetaGPT的工作原理
  - L3.2.3 MetaGPT的应用场景
- L3.3 ChatGLM
  - L3.3.1 ChatGLM的特点
  - L3.3.2 ChatGLM的开发环境
  - L3.3.3 ChatGLM的使用示例
- L3.4 LLAMA
  - L3.4.1 LLAMA的特点
  - L3.4.2 LLAMA的开发环境
  - L3.4.3 LLAMA的使用示例
- L3.5 其他大模型介绍