DeepSeek的余震才刚开始,全球大模型赛道就已开始新一轮洗牌。
2月6日,谷歌一口气发布三款模型:Gemini 2.0 Pro、Gemini 2.0 Flash以及 Gemini 2.0 Flash-Lite。
今天,OpenAI发布了截至目前规模最大、成本最高的模型GPT4.5。不过,该模型并非推理模型,在性能方面与OpenAI此前的几代模型相比存在差距。
就在大家热议GPT4.5之际,百度也迅速官宣:文心大模型4.5将于3月16日发布。
消息刚爆出,就点燃行业内外热议。百度文心大模型4.5的迭代究竟会带来哪些令人期待的新突破?让我们一同抢先预测 。
RAG再次进化、iRAG技术让图像生成告别“幻觉”?
众所周知,百度文心大模型在RAG(检索增强生成)上具有领先优势,其“理解-检索-生成”协同优化的检索增强技术,能显著提升大模型技术及应用的效果,尤其是在降低幻觉上。
2月13日,百度宣布文心一言上线深度搜索功能,和普通AI搜索大有不同,深度搜索主打提供专家级的复杂问题问答查询服务。不只是高级联网,它还能调用文档处理、绘图、代码解释器这些工具,大大拓宽了可执行任务的广度。
官方数据显示,截至目前,文心一言用户规模达到4.3亿,文心大模型日均调用量超过16.5亿次。
此外,百度去年自研的 iRAG(基于图像的检索增强生成)技术, 能够生成超真实图片,有效去除传统文生图中的 “机器味儿”,且成本低廉。
这种技术优势,不禁让人猜测:文心大模型 4.5是否将迎来再次进化,将在幻觉方面降低到新水平?
基于此,业界纷纷推测,文心大模型 4.5 有望在降低幻觉方面取得新突破,达到全新水平。若这一推测成真,无疑将为大模型的实际应用带来更优质体验,无论是在内容创作、设计领域,还是其他依赖高质量图像生成的行业,都将产生深远影响。
多模态、深度思考能力实现突破,将成为百度最强的下一代大模型
目前,生成式 AI 目前面临两大痛点:其一为多模态协同,其二是深度思考能力。
多模态可实现文本、图像、语音的深度融合 ,不仅显著提升推理能力,还在多模态方面取得重大突破,能处理整合文本、视频、图像、音频等多类型数据,并实现格式转换,在处理复杂任务时优势尽显,适配多种场景。
而在业内,大语言模型如何从对话走向深度思考,需要从生成符合人类语言习惯的自然交互,到解决复杂逻辑推理、数学计算、因果推断等问题,一直备受关注。
作为全球最早对标GPT的LLM大模型,文心大模型4.5将以上两个方面实现升级,据百度官方,文心大模型4.5将在基础模型能力上有大幅提升,且具备原生多模态、深度思考等能力,这将是百度最强的下一代文心大模型。
成本再降,让开发者人人可用
除了技术迭代升级这一杀手锏,成本也是不少开发者、企业关注的焦点。2月13日,百度宣布文心一言将从4月1日起全面免费开放,眼看即将到来的百度文心大模型 4.5届时也会对广大C端用户免费使用。大家也开始猜测,对于企业和开发者来说,是否也会在API接入的成本策略上带来一些惊喜?
过去,百度凭借在芯片、框架、集群管理等方面的全栈优化,实现了训练与推理成本的急剧下降,有力地推动了 AI 技术从实验室走向大规模实际应用。
在硬件层面,昆仑芯三代的突破性设计堪称成本革命的动力。
一方面,昆仑芯性能卓越,能够以更少的计算资源支撑像 DeepSeek-V3/R1 这类大规模模型的运行,大幅减少大模型推理和训练所需的计算量,进而直接降低算力成本。
另一方面,昆仑芯万卡集群通过任务并行调度、弹性算力管理等手段,充分发挥规模效应,提升计算资源的利用率,有效避免算力闲置,提高单任务的计算效率,从整体上降低了算力成本。
与此同时,百舸平台助力大规模集群高效部署管理。针对大模型训练高通信带宽需求,百度构建超大规模 HPN 高性能网络,运用优化算法,使带宽有效性超 90%。鉴于万卡集群能耗高,常规散热方案成本大,百舸采用创新散热方案,有效降低能耗与模型训练成本。
此外,借助百度四层技术栈的独特优势,芯片、框架、大模型与终端应用场景形成高效反馈闭环,助力大模型持续调优迭代。
据悉,自发布以来,百度不断降低文心大模型的推理成本。近日,李彦宏在访谈中表示,会持续对芯片、数据中心和云基础设施进行持续投入,来训练更好、更智能的下一代模型。
简单来说,随着文心大模型的迭代升级,未来企业和开发者基于文心大模型开发原生应用或进行二次开发时,能享受更低的推理成本与更高训练效率。
3月16日,拭目以待
半个月前,百度宣告文心一言将从4月起全面免费,文心大模型4.5将在6月底正式开源,当行业还在为千卡集群投入挣扎时,百度已用“免费+开源”的组合拳,将大模型竞技场从“算力军备竞赛”扭转为“创造力公平竞赛”。
正如百度创始人、董事长兼首席执行官李彦宏在百度2024年Q4及全年财报电话会上所说:“无论开源闭源,基础模型只有在大规模解决现实问题时,才具备真实价值。”
百度文心大模型4.5的大升级,我们拭目以待。