AI 大模型在金融行业应用深度分析 2024

核心观点

➢当前AI与金融的结合主要有两条技术路径:①通用模型+金融语料训练金融大模型,②金融垂类大模型。

1)双方优劣具有相对性。通用大模型优势:泛用性强、灵活性和利用率高、可迁移性强。劣势:特定领域深度较浅、模型复杂、训练时间长;金融垂类模型优势:领域专业性、针对性的解决方案、高精度和合规性。劣势:适应性限制、更新和维护复杂度、数据利用率低。

2)通用大模型通过金融语料训练超越金融垂类模型可能性较小。通用大模型在行业数据量,性价比,精确性、适用性、实时性、推理速度,合规性和风险控制等方面表现欠佳。

➢通用大模型“百模大战”,头部模型国外领先较大,平均水平国内外差距较小,中文上国内表现更优。

1)国外通用GPT4-Turbo遥遥领先。OpenAI震撼发布GPT4-Turbo,开启新一代人工智能模型的大门;谷歌将在谷歌云上部署 Claude,并于推出自研的大模型LaMDA 的聊天机器人Bard;AWS 推出自有基础模型 Titan 和 AIGC 服务 Bedrock,以及 AI 编程助手 Amazon CodeWhisperer。Anthropic推出Claude,是最接近ChatGPT的商业竞品;xAI发布其首个AI大模型产品Grok,模型通过X平台实时了解世界,GrokV1.5或于2024年3月发布。

2)国内通用百度先行,多家企业推出相关产品。百度推出“文心大模型”,是目前国内预训练大模型应用端生态最好的大模型之一;阿里发布通义千问2.0,专业维度能力较强;vivo发布BlueLM大模型,应用的场景广泛;月之暗面发布Moonshot大模型,目前位于第一梯队。

3)在金融领域中,通用模型应用表现各有差异。其中GPT系列、文心一言、通义千问、腾讯混元以及科大讯飞表现较好。

➢金融垂类模型国外发展先行,国内成品问世。

1)国外彭博BloombergGPT率先登场。BloombergGPT的混合训练方法使其模型在金融任务上的表现大大超过了现有的大语言模型,而在通用场景上的表现则与之相当,甚至优于现有模型。AI4Finance Foundation开发FinGPT,为金融大型语言模型提供互联网规模的数据,以此推动金融领域的开源发展。

2)国内金融垂类模型百花齐放。奇富科技率先宣布推出自研的金融行业通用大模型“奇富GPT”;度小满推出国内首个千亿级中文金融大模型“轩辕”;腾讯云公布腾讯云金融行业大模型,TI-OCR大模型帮助银行解决日常业务问题;恒生电子进一步升级金融大模型LightGPT,并发布多款光子系列大模型应用产品;蚂蚁集团公布蚂蚁金融大模型,在多项金融专属任务中表现突出;东方财富、同花顺加大AI研发技术投入,筹建人工智能事业部,重点推进金融垂直大模型研发应用。

1.1. 通用+金融VS金融垂类:优劣势对比

➢当前AI与金融的结合主要有两条技术路径:

①通用模型+金融语料训练金融大模型

②金融垂类大模型。

➢由于设计和训练目的不同,通用语言大模型与金融垂类模型在优劣上具有相对性。通用语言大模型在泛用性、灵活性、数据利用率、迁移性上相比金融垂类更有优势,而在专业性、针对性、高精度和合规性上,金融垂类模型更胜一筹;在复杂度问题上,通用语言大模型在结构上更加复杂,影响模型效率,而金融垂类模型则是在更新维护上具有复杂性。

图表:通用与金融垂类大模型优劣对比

在这里插入图片描述

1.2. 通用+金融VS金融垂类:通用金融训练超越金融垂类可能较小

➢使用金融数据对通用大模型进行训练,数据欠缺,成本过高。金融领域的语料应该充分覆盖各种金融产品、市场情况和业务流程等。但金融领域的数据分散在各个金融机构,通用大模型缺少金融数据进行训练,金融专业知识不足;另外一方面,如果从底层开始训练大模型,所需要投入的算力成本非常高,比如千亿级别的通用大模型,训练一次需要付出几千万的成本

➢在特定任务上,精确性与适用性欠缺,需要更多优化与定制。金融垂类大模型通常会投入大量的时间和资源来收集和整理金融领域的专业知识。这些专业知识包括金融术语、金融工具和金融法规等。通用语言模型虽然可以通过金融语料的训练来提高在这方面的理解能力,但是否能达到金融垂类大模型的专业性仍有待验证。

➢金融领域要求实时性和高效的推理速度。金融领域的决策和分析通常要求实时的响应和快速的推理速度。金融垂类大模型可能会针对这一需求进行了优化,以提供更快的响应时间。通用语言大模型在处理金融领域的实时应用时可能需要进一步的优化。

➢金融领域对合规性和风险控制要求极高。金融领域对于数据保护、隐私和风险控制具有严格的要求,专门训练的金融垂类大模型可能会更好地满足这些合规性需求。

国内外通用大模型在金融领域应用表现

2.1. 国内外通用AI大模型发展历程:国外领先,国内紧追

➢2023年6月国内AI大模型迎来爆发式增长,技术和应用不断发展,但与国外顶尖AI大模型尚有差距。自2022年OpenAI发布ChatGPT以来,国内迅速形成大模型共识,开始追赶国外。目前各行各业开闭源大模型不断出新,竞争形势越发激烈。

➢综合表现上,头部模型国外领先,平均水平国内外差距较小。在所有模型中,GPT4-Turbo遥遥领先,国内最好的大模型为百度文心一言,但仍有15.77分的差距。国内方面,虽仍有差距,但在过去一年内发展迅速,平均水平上与国外差距并不明显。此外,国内开源大模型在中文上的表现要优于国外开源大模型。

图表:AI大模型2023年关键进展

在这里插入图片描述
图表:国内外大模型综合表现(2023年11月28日)

在这里插入图片描述
2.2. 国外AI通用大模型案例,OpenAI&微软引领业界

在这里插入图片描述
2.3. 国内AI通用大模型案例,多家企业推出相关产品

  • 文心一言

百度具备先发优势,文心大模型国内领先

文心一言是百度全新一代知识增强大语言模型,于2023年3月16日正式发布,已进行多个版本迭代,10月17日发布V4.0版本。据百度官方介绍,文心一言目前已有7000万用户。文心一言4 . 0的能力栈较为广泛,可应用的场景较多。其在查询搜索知识应用、任务拆解规划Agent、文案写作以及代码编写及纠错等方面的应用表现不俗。

  • vivo BlueLM

vivo发布BlueLM大模型,应用的场景相对广泛

BlueLM是vivo自主训练的大语言模型,出自于vivo AI全球研究院。vivo于11月1日开发者大会上正式发布自研AI大模型矩阵,包括十亿、百亿、千亿三个不同参数量级的5个自研大模型。BlueLM主要可以应用在手机智能应用中,进行基础手机指令操作、实时语音助手、查询信息以及一些基于手机端的办公应用。

  • 通义千问

阿里发布通义千问2.0,专业维度能力较强

通义千问,是阿里云推出的大语言模型,于2 0 2 3年4月1 1日在阿里云峰会上正式发布1.0。9月13日,阿里云宣布通义千问大模型已首批通过备案。10月31日,阿里云正式发布千亿级参数大模型通义千问2.0,8大行业模型同步上线。通义千问2.0专业维度上的能力较强,可应用于相对专业复杂场景 ,例如金融、医疗、汽车等垂直专业场景。

  • kimi

月之暗面发布Moonshot kimi大模型,位于第一梯队

Moonshot kimi是月之暗面自主训练的大语言模型,于10月9日正式发布。该模型具备多语言能力,支持约20万汉字上下文,通过创新的网络结构和工程优化,实现了无损的长程注意力机制,有较强的文档理解、归纳和处理能力。长程对话、长文本阅读、AI智能体等方面的应用表现强劲。另外,在数学运算、内容创作、虚拟数字人等场景也有不错的表现。

2.4. 通用大模型在金融领域应用表现各有差异

➢国外GPT系列在金融领域表现较好。GPT系列能较好理解金融术语,解答金融相关问题,且具备一定的实时性,在金融领域能够自动生成金融报告、做市场研究、客服机器人等。

➢国内百度文心、阿里通义千问、腾讯混元以及科大讯飞在金融领域表现较好。百度文心一言具备较高的实时性,且金融术语的理解较好,准确度高,能够在金融新闻分类、问答系统和智能写作中发挥作用。阿里通义千问能够较好的解释金融概念、提供一般性的金融投资分析指导,但存在时效性限制。腾讯混元可以优化金融服务的个性化体验、市场情绪的追踪等。科大讯飞火星则将语音识别和处理技术用于交易系统、智能财经助手等。

在这里插入图片描述

国内外金融垂类模型发展进程

3.1. 国内外金融垂类模型发展历程:国外发展先行,国内成品问世

➢金融大模型始于2023年3月BloombergGPT,通过应用金融大模型,金融效率将得到大幅提升。彭博推出了为金融领域量身定BloombergGPT模型,吸引了行业关注,大模型有了新的发展方向。金融行业沉淀了大量高质量数据。各金融平台的用户数以亿计,各种用户画像数据、交易数据浩如烟海。利用大模型对上述数据的分析处理,可大幅提高金融效率。比如,金融机构可以预测用户行为偏好,更高效、准确评估客户风险;AI还可以实时监测交易和市场波动,及时制定策略。

➢当前国内外金融行业都在主动拥抱大模型。IDC(国际数据公司)一项调研显示,超半数的金融机构计划在2023年投资生成式人工智能技术,只有10%的金融机构表示没有试验计划。国外自BloombergGPT后,也出现了如FinGPT等一系列金融大模型。而国产金融大模型也已分出了明显的两个“流派”。一派来自于传统金融机构,另一派来自于金融系科技企业或互联网企业。

图表:国内外金融垂类AI模型发布时间&发布机构

在这里插入图片描述
3.2.1. 国外金融垂类模型案例:彭博BloombergGPT

➢彭博BloombergGPT率先登场,金融任务表现远超通用模型。2023年3月底,彭博构建了迄今为止最大的特定领域数据集,并训练了专门用于金融领域的LLM,开发了拥有500亿参数的语言模型BloombergGPT。该模型依托彭博社的大量金融数据源,构建了拥有3630亿个标签的数据集,支持金融行业内的各类任务,彭博近40年来在金融领域积累的数据占比为51.3%,剩余的48.7%则来自于公开数据。训练结果表明,BloombergGPT的混合训练方法使其模型在金融任务上的表现大大超过了现有的大语言模型,而在通用场景上的表现则与之相当,甚至优于现有模型。

➢彭博BloombergGPT相比于通用大模型有诸多优势。BloombergGPT模型对金融领域理解更为深刻,并借助其针对性强、来源可靠的金融数据,提供了深度专业的分析能力,同时通过协助优化金融NLP任务,助力提升彭博终端数据的应用价值,开辟金融行业分析和决策的新可能性。

图表:BloombergGPT执行金融任务表现显著优于通用大模型,通用NLP基准上表现相当或更好

在这里插入图片描述
3.2.2. 国外金融垂类模型案例:FinGPT

➢FinGPT是由AI4Finance Foundation开发的一种专门为金融领域设计的语言模型。它的目标是为金融大型语言模型(FinLLMs)提供互联网规模的数据,以此推动金融领域的开源发展。FinGPT采用以数据为中心的方法,强调了数据采集、清理和预处理在开发开源FinLLM中的关键作用。通过支持数据可访问性,FinGPT渴望加强金融领域的研究、合作和创新,为开放金融实践铺平道路。FinGPT由四个基本组件组成:数据源、数据工程、LLMs和应用程序。

图表:FinGPT功能模块

在这里插入图片描述
➢【应用层】:FinGPT的最后一个组成部分是应用层,旨在展示FinGPT的实际适用性。它为金融任务提供实践教程和演示应用程序,包括机器人咨询服务、量化交易和低代码开发。

➢【LLMs层】:处于核心位置,它包含各种微调方法,优先考虑轻量级适应,以保持模型的更新和相关性。

➢【数据处理层】:该层专注于NLP数据的实时处理,以应对金融数据固有的高时间敏感性和低信噪比的挑战。

➢【数据源层】:FinGPT管道的起点是数据源层,它协调从各种在线资源中获取大量财务数据。

3.3.1. 国内金融垂类模型案例:腾讯云金融行业大模型

腾讯云混元大模型,为客户提供一站式MaaS服务

➢2023年9月7日,腾讯混元大模型正式亮相,10月26日正式对外开放“文生图”功能,同时模型的中文能力整体超过GPT3.5,代码能力大幅提升20%,达到业界领先水平。算力层面,推出高性能的计算集群HCC,作为大模型的算力底座。平台层面,提供一站式机器学习平台TI,以及 QGPU 容器调度平台以及向量数据库。模型 MaaS 层面,提供 L0 层面混元大模型, L1 层面金融行业大模型,以及各类针对下游场景任务的 L2 的模型,如智能客服、智能咨询、辅助分析和决策服务。腾讯云TI-OCR大模型帮助银行解决日常业务问题

➢腾讯云推出的TI-OCR大模型提供多种识别模式,包括智能结构化、固定版式结构化、检测/识别、智能分拣。TI-OCR大模型具备原生大模型支持、通过prompt设计支持复杂任务、多模态技术提高召回率的特点。通过应用TI-OCR大模型,可实现自动化的数据处理和高度结构化,将数据识别准确率提高至95%以上。这一应用降低了高重复手工劳动,减少了运营成本,实现了多元业务数据处理的标准化、线上化和自动化。

在这里插入图片描述
3.3.2. 国内金融垂类模型案例:恒生电子LightGPT+WarrenQ

恒生电子LightGPT重磅升级,各项能力均超国内通用大模型

➢2023年10月19日,恒生电子发布金融大模型LightGPT最新的能力升级成果,以及基于LightGPT打造的多款光子系列大模型应用产品,并宣布正式开放产品公测。目前相较于6月发布的版本,LightGPT在整体模型效果上提升15%,安全合规性上提升13%,推理速度上提升50%,并面向金融机构实现LightGPT-7B的开源,推理和训练全面适配华为昇腾系列。在投顾场景中, LightGPT在各个方面平均超出国内通用大模型13%。在投研场景中,LightGPT平均超出国内通用大模型12%。

在这里插入图片描述
“WarrenQ+光子”持续加强金融垂域“搜读算写

➢继6月底恒生电子推出WarrenQ-Chat和ChatMiner两款大模型工具后, WarrenQ上新了 AI写作、语音速记、小程序、招股书/公告深度问答四款新功能,并持续深入私有知识库问答、智能投顾/投研chat助手等金融业务场景。

目前,WanrrenQ服务于数家证券公司,覆盖券商投研、财富、投行、固收等业务系统,为业务人员提供智能化的数据分析和交互技术,提升业务人员工作效率,持续加强大模型加持下的金融垂域“搜读算写”能力。此外,恒生推出了金融智能助手‘光子’,光子可以为金融机构的投顾、客服、运营、合规、投研、交易等业务系统注入AI能力,成为金融从业人员的AI助手。”

3.3.3. 国内金融垂类模型案例:蚂蚁金融大模型

在这里插入图片描述
蚂蚁金融大模型现世,多场景达行业专家水平

➢2023年9月8日外大会上,蚂蚁集团正式公布蚂蚁金融大模型。蚂蚁金融大模型聚焦真实的金融场景需求,在“认知、生成、专业知识、专业逻辑、合规性”五大维度28类金融专属任务中表现突出,在“研判观点提取”、“金融意图理解”等众多领域达到行业专家水平。

专业力方面,平台上有完备的数字化金融工具矩阵,蚂蚁金融大模型可通过理解用户语言,精准调用蚂蚁体系内的这些专业工具,给用户提供相应专业服务。

支小宝2.0+支小助1.0促进金融领域服务革新

➢得益于金融大模型带来的知识力、专业力提升,支小宝2.0的智商和财商提升到了新水平,能帮助用户深度解读市场信息、并结合用户的财务目标、投资偏好等,提供个性化的配置策略。知识力方面,做到了有问必答。专业力方面,提供一系列的专业化服务,300多款专业化工具,通过自然语言能够打理,能够操控以上所有服务。语言力方面,支小宝2.0的金融意图识别准确率高达95%。

➢智能业务助手“支小助”的1.0版本,则包含了“服务专家版”、“投研专家版”等六个版本,全方位服务不同金融场景的从业人员,可在投研分析、信息提取、商机洞察、金融工具使用等环节提供深度智能服务。

3.3.4. 国内金融垂类模型案例:东方财富奇思妙想金融大模型

➢东方财富深入AIGC、交互式AI等领域的研究,进一步巩固流量优势。公司已经陆续研发了东方财富金融数据AI智能化生产平台、多媒体智能资讯及互动平台系统等多个人工智能相关项目,并在公司部分产品及服务中进行了具体应用。公司将继续紧跟AI技术发展前沿,不断加强AI能力建设,进一步强化自然语言处理、图像处理、语音识别和多模态融合技术能力,并继续深入AIGC、交互式AI等领域的研究,完善内容生态构建,AI赋能提升用户各场景使用体验和服务能力,未来或创造新的场景以挖掘客户全生命周期需求,进一步巩固流量优势并提高客户转化率。

➢东方财富加大AI研发技术投入,筹建人工智能事业部,重点推进金融垂直大模型研发应用。8月11日,东方财富公告称公司将整合业务及研发力量,组建人工智能事业部。公司具备广泛的AI应用场景,且沉淀了大量有效金融数据,有望通过此次组织架构调整提升AI技术能力,未来将在AI+金融领域实现更大突破。

在这里插入图片描述
3.3.5. 国内金融垂类模型案例:同花顺HithinkGPT大模型

➢问财升级,HithinkGPT大模型开启内测。2023年12 月6 日,同花顺开启了问财升级版的内测,底层已经升级为Hithink GPT 大语言模型,结合海量金融领域数据和知识,通过自然语言对话,协助投资者进行标的选择、标的诊断、资讯解读、投资教学等全方位投顾服务。考虑到同花顺坐拥3000 万+月活流量,以及B 端产品iFind 业务的快速增长,同花顺大模型有丰富的落地场景。

➢B端iFinD产品逐渐完善AI功能,AI开放平台提供多种AI服务。公司的iFinD产品实现了基于语音交互与智能搜索服务、机器阅读研报、研报知识图谱自动生成等一整套智能化解决方案,技术实力和功能处于业内领先,预计iFinD+大模型结合基础功能补齐、性价比优势有望引领中期份额突破;同花顺AI开放平台目前可面向客户提供短视频生成、文章生成、数字虚拟人、智能金融问答、智能语音、智能客服机器人、智能质检机器人、会议转写系统、智能医疗辅助系统等多项AI产品及服务。

在这里插入图片描述
➢伴随着金融大模型应用的不断深化和拓展,当下金融大模型已经不局限于文本生成和虚拟客服等领域,而是开始广泛应用于金融资讯发布、产品介绍内容创作等。展望未来,随着更多的金融大模型陆续落地,将采用更加精细化处理行业细分场景,同时孕育出新的应用场景,为传统业务注入新活力,也为金融领域带来新的业务机会。这将全面提升金融服务的效能,推动金融业务生态的全面重塑,为金融行业持续的前进和革新铺平道路。

➢我们认为2024年金融垂类AI大模型将迎来前所未有的蓬勃发展,形成一番百花齐放的景象。而具备AI模型技术领先优势、较大金融交易数据基础、较好应用场景入口、积极推进AI模型构建的金融科技企业将持续受益。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值