核心观点
➢当前AI与金融的结合主要有两条技术路径:①通用模型+金融语料训练金融大模型,②金融垂类大模型。
1)双方优劣具有相对性。通用大模型优势:泛用性强、灵活性和利用率高、可迁移性强。劣势:特定领域深度较浅、模型复杂、训练时间长;金融垂类模型优势:领域专业性、针对性的解决方案、高精度和合规性。劣势:适应性限制、更新和维护复杂度、数据利用率低。
2)通用大模型通过金融语料训练超越金融垂类模型可能性较小。通用大模型在行业数据量,性价比,精确性、适用性、实时性、推理速度,合规性和风险控制等方面表现欠佳。
➢通用大模型“百模大战”,头部模型国外领先较大,平均水平国内外差距较小,中文上国内表现更优。
1)国外通用GPT4-Turbo遥遥领先。OpenAI震撼发布GPT4-Turbo,开启新一代人工智能模型的大门;谷歌将在谷歌云上部署 Claude,并于推出自研的大模型LaMDA 的聊天机器人Bard;AWS 推出自有基础模型 Titan 和 AIGC 服务 Bedrock,以及 AI 编程助手 Amazon CodeWhisperer。Anthropic推出Claude,是最接近ChatGPT的商业竞品;xAI发布其首个AI大模型产品Grok,模型通过X平台实时了解世界,GrokV1.5或于2024年3月发布。
2)国内通用百度先行,多家企业推出相关产品。百度推出“文心大模型”,是目前国内预训练大模型应用端生态最好的大模型之一;阿里发布通义千问2.0,专业维度能力较强;vivo发布BlueLM大模型,应用的场景广泛;月之暗面发布Moonshot大模型,目前位于第一梯队。
3)在金融领域中,通用模型应用表现各有差异。其中GPT系列、文心一言、通义千问、腾讯混元以及科大讯飞表现较好。
➢金融垂类模型国外发展先行,国内成品问世。
1)国外彭博BloombergGPT率先登场。BloombergGPT的混合训练方法使其模型在金融任务上的表现大大超过了现有的大语言模型,而在通用场景上的表现则与之相当,甚至优于现有模型。AI4Finance Foundation开发FinGPT,为金融大型语言模型提供互联网规模的数据,以此推动金融领域的开源发展。
2)国内金融垂类模型百花齐放。奇富科技率先宣布推出自研的金融行业通用大模型“奇富GPT”;度小满推出国内首个千亿级中文金融大模型“轩辕”;腾讯云公布腾讯云金融行业大模型,TI-OCR大模型帮助银行解决日常业务问题;恒生电子进一步升级金融大模型LightGPT,并发布多款光子系列大模型应用产品;蚂蚁集团公布蚂蚁金融大模型,在多项金融专属任务中表现突出;东方财富、同花顺加大AI研发技术投入,筹建人工智能事业部,重点推进金融垂直大模型研发应用。
1.1. 通用+金融VS金融垂类:优劣势对比
➢当前AI与金融的结合主要有两条技术路径:
①通用模型+金融语料训练金融大模型
②金融垂类大模型。
➢由于设计和训练目的不同,通用语言大模型与金融垂类模型在优劣上具有相对性。通用语言大模型在泛用性、灵活性、数据利用率、迁移性上相比金融垂类更有优势,而在专业性、针对性、高精度和合规性上,金融垂类模型更胜一筹;在复杂度问题上,通用语言大模型在结构上更加复杂,影响模型效率,而金融垂类模型则是在更新维护上具有复杂性。
图表:通用与金融垂类大模型优劣对比
1.2. 通用+金融VS金融垂类:通用金融训练超越金融垂类可能较小
➢使用金融数据对通用大模型进行训练,数据欠缺,成本过高。金融领域的语料应该充分覆盖各种金融产品、市场情况和业务流程等。但金融领域的数据分散在各个金融机构,通用大模型缺少金融数据进行训练,金融专业知识不足;另外一方面,如果从底层开始训练大模型,所需要投入的算力成本非常高,比如千亿级别的通用大模型,训练一次需要付出几千万的成本
➢在特定任务上,精确性与适用性欠缺,需要更多优化与定制。金融垂类大模型通常会投入大量的时间和资源来收集和整理金融领域的专业知识。这些专业知识包括金融术语、金融工具和金融法规等。通用语言模型虽然可以通过金融语料的训练来提高在这方面的理解能力,但是否能达到金融垂类大模型的专业性仍有待验证。
➢金融领域要求实时性和高效的推理速度。金融领域的决策和分析通常要求实时的响应和快速的推理速度。金融垂类大模型可能会针对这一需求进行了优化,以提供更快的响应时间。通用语言大模型在处理金融领