预训练模型在金融 NLP场景下的应用

近三年来,大规模预训练模型深入应用于金融场景中,大幅度地提升了业务系统的开发效率。本次报告将分享目前大模型技术在金融场景下的应用现状及未来发展趋势,并介绍澜舟团队基于孟子轻量化模型支持金融场景并通过SaaS输出各项标准 NLP 能力的技术进展。

大模型技术背景

我先谈谈大模型的一些背景。此前十余年人工智能在感知智能方面进展迅速。而在2017年谷歌提出了Transformer,随后预训练模型BERT提出,随后以2019年阅读理解超过人类水准为代表,NLP能力在各项任务上大幅度提升。

1. 认知智能崛起

我们今天看到的一个明显趋势是AI正由感知智能快速向认知智能迈进。AI正在从能听能说会看,这些都是感知智能的能力,走到能思考、能回答问题,做总结,能翻译,能创作(音乐、对联、诗歌、散文,写报告),走到决策和推理。这些都是认知智能的能力。认知智能的应用例子比比皆是。

图 1

在图 1 右侧可以看到其广泛的应用。例如,达到了接近人类水准的机器翻译已经在手机和桌面普遍使用,聊天机器人几乎可以通过图灵测试,搜索引擎得益于阅读理解以及预训练模型,搜索相关度大幅度提升,自动客服系统已经普及,知识图谱在金融等领域得到快速应用,都在推动产业发展。

从大数据,到建立信息检索,到建立知识图谱实现知识推理,到发现趋势形成观点和洞见。认知智能在大数据支持下,推动企业的业务数智化,正在深刻影响产业的发展。可以说NLP和认知智能代表了人工智能的未来发展。

2. 大规模预训练模型的新范式

在认知智能崛起过程中,预训练成为了认知智能的核心技术。 2017年推出的Transformer,催生了BERT、GPT、T5等预训练模型。这些模型基于自监督学习(也就是不需要人工标注),利用大规模文本,比如互联网的浩瀚的数据,学习一个语言模型。利用语言模型对输入句子的每一个词在当前上下文的句法、语义和搭配有一定程度的理解。在此基础上,针对每一个NLP任务,用有限的标注数据进行微调。

这种迁移学习技术推动了NLP发展,各项任务都上了一个大台阶。更为重要的是,产生的预训练+微调技术,可以一套技术解决不同语言NLP、不同的NLP任务,有效地提升开发效率。 原先NLP不同任务要用不同的模型,需要不同的技能人员,而且语言之间也不能互通。现在用预训练加微调,可以一套机制应对多有语言的所有任务,这标志着NLP进入到工业化实施阶段。

图 2

当前在预训练模型领域较为关注的研究重点包括:

  • 如何训练超大规模参数的模型。各大公司推出越来越大的模型,千亿甚至万亿参数。对已有模型架构的创新性研究、更加有效的训练方法和训练加速的方法。

  • 简化微调的步骤,比如像GPT-3那样用一套提示机制来简化下游任务的微调,推动零样本学习和小样本学习。

  • 多模态预训练模型也引起关注。图文、文图、视频、code生成。最后就是推理的加速方法也是目前的研究焦点, 用硬件来实现加速训练也是重要方向。

金融 NLP 场景

1. 场景与应用举例

NLP在金融有很多应用,概括来讲有智能风控、智能投顾、智能投研、智能营销等等。无论哪一个场景,目前的技术水平,虽然可以用了,但是都还是面临很多挑战。

图3 NLP在金融领域的应用划分

金融行业主要包含银行、保险、券商、资管等三大类机构。每一类机构都有很多NLP的应用场景。这里我归纳如下(图 4)。

银行的NLP应用场景主要有,信贷辅助决策,公司债业务审核、智能客服、企业知识库建设等。每一个场景涉及到一系列的任务,比如信贷辅助决策,涉及到财务报告解析、公司舆情智能挖掘、信贷流水材料智能处理、公关行业景气度分析、风险事件传导分析。这些任务的背后涉及到一系列NLP技术,诸如信息抽取、OCR、表格解析、分类、情感、事件抽取和打标签、领域和专家知识等等。

保险的NLP应用场景主要有,包括智能合同审核、智能付款材料审核、智能工单处理等等。同样也涉及到一系列任务和NLP技术。

券商和资管的NLP应用

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值