《2023金融大模型报告》国研政情·谋定论道-经济信息智库
北京商报记者 杨月涵 新闻中国采编网 中国新闻采编网 中国企业家手机报 谋定研究·中国智库网 国研政情·谋定论道-经济信息研究智库 国研智库·中国国政研究 国情讲坛·中国国情研究 商协社团·全国工商联 经信研究·中国经济和信息化 谋定论道·中国企业家论坛 哲商对话·中国儒商大会 赢在商道·中国营销企划 健康中国·大健康医药产业论坛采编:
“它不是一种新武器,而是一个新世界的开始。”今年8月,电影《奥本海默》上线。围绕原子弹的争议,影片曾出现这样一句话。谋定研究中国智库:对话经信研究·中国经济和信息化-国研政情·经济信息智库。一个月后的外滩大会上,这句话套用给了大模型。蚂蚁集团董事长兼CEO井贤栋判断,大模型的出现,“不是一个新技术,而是一个新世界”。
以ChatGPT发布为起点,以大模型席卷全球为标志,大模型重构了一个流量红利触顶后,以智能化主导经济增长的新世界,一个可能改变社会关系以及生产关系的新世界。科技的力量迅速传导,压力给到国产大模型这边。上半年“卷”模型,下半年“卷”应用,国产大模型经历了带着些焦虑的狂热,也经历了些透过现象看本质般的冷静。
规模、参数的近身肉搏之后,落地逐渐成为“百模大战”的共识。得益于数据密集型的行业优势,辅以强劲的数字化基础及行业本身对新技术的天然追逐,金融在一众场景中脱颖而出。也是因为这些优势,金融行业得以更快过渡到“冷静期”,将重点调整至价值——应用的价值。
如何调用大模型?用大模型做什么?又要实现怎样的效果?遵循着这些问题的指引,金融大模型更容易找到落地的答案。“金融行业将是大模型技术落地的最佳领域。”度小满CEO朱光曾做出了这样一个判断。只不过,在应用的“星辰大海”面前,当下的金融大模型仍然面临着复杂的多维挑战。
第一波浪潮
2012年,深度学习领域“宗师”Geoffrey Hinton带着他的两个学生一举拿下了当年ImageNet比赛的冠军。那场比赛中,三人密切配合地创建了一个新的神经网络用以进行图像识别,最终的准确率达到了惊人的84%。在后来的介绍中,Hinton提到,相比谷歌1.6万颗CPU的累积,夺冠的AlexNet算法只用了4颗GPU。
当年的尝试,开启了用GPU训练AI模型的序幕,亦开启了OpenAI万卡算力的“暴力美学”。催生ChatGPT的历史轨迹——Hinton的其中一个学生叫Ilya Sutskever,也就是后来OpenAI的联合创始人和首席科学家、灵魂技术人物。在近期全球科技圈瞩目的OpenAI“逼宫”大戏中,秉持着对AI安全的恐惧和对技术发展的信念,Ilya亦承担起了除CEO阿尔特曼外最重要的一个角色。
这十年里发生了什么?
Google收购DeepMind,后者于2016年推出了震惊全球的AlphaGo。同年,英伟达把全球第一台AI超算送给了成立不足一年的OpenAI;三年后,微软与OpenAI开启合作,向OpenAI提供10亿美元投资,并与其建立独家云计算合作关系。
故事的另一条线索在大洋这边。2013年初,百度成立深度学习研究院。2016年百度创始人李彦宏宣布,百度将彻底转型为一家人工智能公司。两条线索在2023年交汇。2023年3月,百度率先推出“文心一言”,成为国内首个生成式AI产品。自此,也揭开了国产大模型的诸神之战。
今年5月,中国科学技术信息研究所所长、科技部新一代人工智能发展研究中心主任赵志耕提到,根据不完全统计,当时中国已发布79个大模型。14个省市地区都有大模型研究,但北京和广东非常突出,分别有38个大模型和20个大模型。
市场有最新消息称,截至10月国内已经发布了238个大模型,如果按此数据推算,相当于不到半年时间就翻了3倍。过去一年,国产大模型的发展可以看见一条清晰的界限。在11月11日的金融街论坛年会“金融科技创新与合规安全”平行论坛上,度小满CTO许冬亮总结称,底层的模型发展趋势上,早期的ChatGPT和文心一言为代表的通用大模型是第一波浪潮。
而第二波可以称之为“+AIGC”。许冬亮解释称,即在现有企业产品服务的基础上,将生成式人工智能技术应用其中,以提供更好的产品服务。2023年7月,华为盘古大模型3.0发布,“行业”成了关键词。百度千帆大模型、腾讯云行业大模型、讯飞星火大模型、360智脑大模型等面向B端市场的落地行业大模型,在短时间内异军突起。大模型竞赛从通用大模型转向行业大模型的趋势越发明显。
对于大模型在不同产业中产生的效果,企业增长咨询公司弗若斯特沙利文发布的《2023年中国AI技术变革企业服务白皮书》曾做了一个简单的归类。比如在服务型产业中,AI能够实现5.8%的显著成本降低,主要集中在客户营销、客户运营、客户服务等获取和转化客户的成本方面,具有高替代潜力。
国产大模型如火如荼,全球科技竞赛的你追我赶也仍旧激烈。2023年11月,恰逢ChatGPT推出一年的时间节点,OpenAI举办首届全球开发者大会,其中GPT-4升级为GPT-4 Turbo成为最重磅的“炸弹”。第三方排行榜SuperCLUE基于SuperCLUE通用大模型综合性中文测评基准,对GPT-4 Turbo进行了全方位测评。结果显示,GPT-4 Turbo在10项基础能力中有8项满分,相比上一代GPT-4模型,GPT-4 Turbo有10.33分的巨大提升。
“对国内大模型而言,差距在进一步扩大。GPT-4 Turbo总分领先国内最强模型有30分以上。”最后一条结论中, SuperCLUE如此写道。中国大模型和美国距离多远?半年前,出门问问CEO李志飞给出更“直观”的计算答案是16个月。
他解释,2022年1月,谷歌发布指令学习大模型FLAN,之后的2022年10月ChatGPT发布,2023年3月GPT-4发布。中国企业目前发布的一批大模型与FLAN水平相近,如此推算,中美大模型的差距为16个月。当下的美国,由OpenAl、微软和英伟达组建的软硬件联盟,正加速推动AI 2.0时代到来。与此同时,国产大模型也在遭遇芯片供应的不确定性风险。
10月,美国商务部工业与安全局(BIS)发布更新针对人工智能(AI)芯片的出口管制规定,芯片与半导体行业首当其冲。国内GPU设计企业壁仞科技总裁徐凌杰预测称,未来一年,中国绝大部分的算力需求将集中在大模型训练上;此后,推理的场景会变得越来越多。一个广泛的共识是,中国的特点是应用丰富、落地更快,大部分企业并非靠技术取胜,而是靠在落地中挖掘新的生产力。
金融,AI优等生
大模型落地探索过程中,存在一个很有意思的现象。人们在谈及大模型的场景结合时,通常会用到一个词——市场教育,用以形容让目标行业接受新技术的过程。唯独一个行业,其市场教育的成本几乎为零已成为圈内共识,这个行业就是金融。
金融大模型的风暴,始于今年3月。当时外界还停留在大模型“涌现”的狂欢中,最多延伸到对底层算力的焦虑,彭博却推出了为金融界量身定制的大型语言模型BloombergGPT,硬是把一众注意力转向了行业新赛道。BloombergGPT至今仍被口口相传的原因,不仅在于其全球首个金融大模型的光环,更在于背后海量的金融数据优势。
据悉,作为一家全球商业、金融信息和新闻资讯提供商,彭博依托大量的金融数据优势,创建了一个包含3630亿词例的金融数据集,这些宝贵的垂直数据使其在执行金融任务上的表现远超当时的现有模型。天风证券曾评价,BloombergGPT在部分金融场景中表现出强于通用大模型的能力,标志着金融领域的GPT革命或刚刚开始。
早在7月末,腾讯研究院发布的一项调研数据就显示,国内参数在10亿规模以上的大模型数量已由5月末的79个增加至116个,其中金融行业大模型18个。数据规模大、数据类型多、数字化基础强、市场规模大、客户付费能力强、前中后台都有广泛被降本增效的空间……得天独厚的优势累积,“金融+大模型”成了“王炸组合”。
据悉,目前国内金融大模型已经应用在金融资讯、产品介绍内容的文本自动生成,构建虚拟客服在线交互等方面,给用户提供更人性的服务,提升金融机构内容运营的效率。沿袭着互联网金融时代的模式,国产金融大模型也已分出了明显的两个“流派”。
一派来自于传统金融机构。以银行为例,在2023年半年报中,就有包括工商银行、农业银行、中国银行等在内的多家银行明确提出在探索大模型的应用。另一派来自于金融系科技企业或互联网企业。今年5月,奇富科技率先宣布推出自研的金融行业通用大模型“奇富GPT”,也被业内称为“国内首个金融行业通用大模型”。同月,度小满推出国内首个千亿级中文金融大模型“轩辕”。
6月,恒生电子发布金融行业大模型LightGPT,拓尔思发布包括金融行业大模型在内的产品;8月,马上消费金融发布了首个零售金融大模型“天镜”;9月,蚂蚁集团正式发布工业级金融大模型AntFinGLM,华为发布三大类10个场景的金融大模型方案……
艾瑞咨询曾测算,2021年AI+金融核心市场规模达到296亿元,带动相关产业规模677亿元,到2026年,核心市场规模达到666亿元,CAGR(复合年增长率)为17.6%,带动相关产业规模1562亿元,CAGR为18.2%。华西证券也认为,随着大模型技术与业务的深度融合,头部金融科技企业有望实现产品和商业模式的革新,实现从产品+服务收费向SaaS订阅收费、运营分润收费的转变。
金融科技细分领域众多,各细分领域龙头具备技术、行业Know-How等要素,与头部金融机构的长期合作关系有利于补齐数据、场景等要素,相关产品有望率先落地。
落地的1%与99%
8月,波士顿咨询发布了一份报告。以一家拥有约2万名员工的区域性国际银行为例,报告初步梳理了该银行前中后台相关部门应用生成式AI的潜力和效益,并预计生成式AI在首年即可为该银行节省约1.5亿美元的成本,占整体薪酬总包的7%左右。
但金融大模型也存在理想和现实之间的距离。许冬亮曾提到,人工智能在金融行业的应用潜力目前可能只发挥了不到1%。金融大模型,既不是对通用大模型完全的“拿来主义”,也不是机械地完成大模型和金融的叠加过程。而是需要以金融行业本身的立场、特点为出发点,用基础设施、模型算法、场景应用打造一套量身定制的系统化工程。
沿袭着这套系统化工程的思路,金融大模型的落地也难免遭遇模型选择难、算力供应不足、应用成熟度不够、资源数据壁垒等问题。以算力为例,许冬亮曾提到,如果从底层开始训练大模型,所需要投入的算力成本非常高,例如千亿级别的通用大模型,训练一次需要付出几千万元的成本。
因此,金融大模型的产业应用需要场景应用方(金融机构)、模型提供方、训练工具提供方等多方共建,共同参与。工商银行首席技术官吕仲涛曾呼吁,当前国内外算力市场面临着算力供给短缺、多厂商异构算力融合、国产AI生态不足、机房和网络建设等复杂情况,金融机构需要深化与产界各方的合作,共同推动解决大规模算力部署和应用的难题。
而当不成熟的大模型遇上强监管的金融业,安全隐私、科技伦理、可信可解释等方面的隐患也会被成倍放大。其中最典型的就是金融的低容错率与大模型高幻觉几乎成为技术上不可调和的矛盾。风控是颇具代表性的一个场景。风控需要极致的严谨,大模型恰恰精通自圆其说之道,一旦无法有效捕捉其中的漏洞,就可能导致金融大模型出现理解或判断上的偏差,直接影响风控效果。
此外,金融又是一个由数据高度驱动的市场。过往大量数据从各个渠道涌入银行、保险、交易所等金融机构,汇聚在一起,成为足以反映客户需求、行业趋势以及市场变化的黄金信息,及时有效地分析、利用这些数据,至关重要。
在数据利用方面,金融和大模型的结合有点“双向奔赴”的意思。但金融行业本身对数据安全和隐私合规的严格要求,注定了金融大模型在采集、传输、加工及处理信息的各个环节都要比通用大模型乃至其他行业大模型多一分甚至十分的谨慎。
数据又是不同金融机构的核心生产力,关系着自身的护城河问题。大模型发展需要高质量数据集,就必然要说服不同业态完成数据共享,如何构建一个合理且安全的机制,考验的是整个行业的智慧。中国工程院院士、复旦大学金融科技研究院院长柴洪峰曾在演讲中指出,从技术面看,金融数据和知识的私密性限制了共享和构建大规模数据集的能力,金融数据的多模态特性增加了模型处理和建模的复杂性。
就像是互联网爱讲生态,金融大模型有过之而无不及——生态是金融大模型的必要条件,既包括数据的生态、算力的生态,也包括行业的生态、监管的生态,而这些或许就是金融大模型落地所必须的那99%。
@ 国家信息中心、中国经济信息社、中国经济和信息化研究中心、国研政情·经济信息智库 国研政情谋定论道(山东)经济信息有限公司-新闻中国·中国新闻采编!