一场AI技术引发的金融业“降本增效”

c5dd160854972a4a94b9b30335ab58c7.jpeg

文 | 卖萌酱

大家好,我是卖萌酱。

“全面赋能千行百业”是AI的重要使命,政务、法律、金融、医疗、制造等传统行业往往智能化程度低,在效率、成本和收益方面蕴藏着巨大的优化空间。其中,金融业,就正在AI技术的赋能下,发生着一场“降本增效”的变革。本文详细聊聊这个话题。

我们分别从“场景”、“技术”和“工具”层面进行展开。

c5d6776ccf6d2d9e85e723db43acf2cc.png场景672dd58d7875778ece39a8ee398bb528.png

场景层面,提到AI+金融,可能会有人很快想到“股价预测”,但其实比起令人琢磨不透的股价波动,金融行业存在着更多收益确定性高、AI价值附增显著的业务场景。举几个例子:

  • 基于CV技术实现“印章弯曲文本检测与识别”;

  • 基于NLP技术实现的“上市公司公告风险事件提取”、“保险领域智能问答系统”;

  • 基于跨模态技术实现的“扫描版合同关键信息抽取”、“表格识别与属性分析”、“双录稽查场景智能音视频质检”;

  • 基于CV检测技术、智能推荐技术实现“银行网点来客画像分析与精准营销”等。

可以说,AI正在深入到金融行业的方方面面,酝酿一场巨大的“降本增效乃至增收”的行业变革。

6abb42c78f479a43f135c3ed041ec31f.png技术0cecc20093a6c823a5bbfefceeea8199.png

深耕技术深度和先进性常常能在互联网行业产生可观的收益,同样的,只要方向对,先进的AI技术用在传统行业的场景里同样能起到事半功倍的效果。

以金融保险领域客服业务场景为例,客服系统对客服人员有一定的专业性要求,导致企业人工成本高;实际场景中,用户常见的问题占了60%~70%,这部分人工重复性工作费时费力,因此,众多金融企业搭建了智能FAQ问答系统。常见的方案有诸多不足:

  • 一种方式基于保险关键字的问答匹配,该方法效果有限,无法对语义信息进行精准建模,且优化起来较为繁琐;

  • 基于语义匹配搭建问答系统,是越来越常见的做法,然而往往需要人工、半人工方式构造FAQ的“标准问”与“非标准问”,标注成本高,而且经常难以招架真实用户千变万化的表达方式,导致“人工智能”被用户吐槽成“人工智障”,可谓费力不讨好。

而百度研发了先进的端到端智能问答技术RocketQA,不仅在学术竞赛榜单MS MARCO多次刷新记录,而且实现了精准、泛化能力强的语义召回,在实际应用中大大减少了传统离散检索引入的人工构建开销。

66ba3bb118599d1f6ffb34977ffff7b9.png

RocketQA训练技术,可以借助cross-encoder精排模型的优势,有效地为语义召回模型挖掘困难样本,进而提升系统的语义召回能力;优化后的语义召回模型又进一步的提升了召回样本的质量,有助于后续打造效果更强的cross-encoder模型,提升模型的精排能力和最终的答案准确度。再结合人工标注的百万级问答数据集DuReader,效果非常强悍!

5466aa5ad9989631c6899fe06a822130.png

总之,基于端到端智能问答技术RocketQA构建出的FAQ问答系统,不仅构建效率大大提升,且无需标注数据、比传统技术方案具备显著的效果优势。

更进一步的 ,卖萌酱还使用了百度今年发布的集可信分析和增强于一体的可信AI工具集-TrustAI,问答效果有进一步提升。对NLP领域数据标注的常见问题,如“训练数据中存在脏数据限制模型效果提升”,“数据标注成本太高但又不清楚该标注什么数据”,“数据分布有偏导致模型鲁棒性差”等,TrustAI发布了多项功能帮助NLP开发者解决训练数据缺陷问题,用最小的标注成本获得最大幅度的效果提升。

以上技术均已开源。对智能问答技术赋能金融行业智能客服感兴趣的同学,可以关注9月27日的直播,扫码填写基本需求信息即可报名。

89cb46795291fb93390834a1d82f7ce5.jpeg

课程来源于百度飞桨&百度智能云举办的一个AI+金融行业系列直播(文末附系列课整体海报),从中可以看到AI在金融行业的风控、运维、营销、客服等场景都有大量的介入空间。

然而,如果徒有先进的AI技术,却没有配套的高效落地工具,那传统行业的落地依然困难重重,工具的重要性不言而喻。

624c90240610392924024a7cbec1ff3d.png工具76aabcb5a2f78e5d5c29d1835f1a23af.png

“深度学习,NLP啥的太难懂了,我们一时半会搞不定” ——来自行业人员吐槽

“需求场景太多了,人手不够,开发不过来” ——来自AI专业人员吐槽

这是AI在传统行业落地时经常在行业侧和互联网AI平台侧遭遇的灵魂抱怨。

究其原因,就在于大部分的AI落地工具是面向专业AI从业者开发的,对行业落地来说门槛过高或开发效率过低。而市面上的一些门槛低的AI平台又往往会牺牲灵活性,开发时会有较多的限制。

不过,百度飞桨PaddleNLP不久前发布了NLP流水线系统 Pipelines,卖萌酱试用后发现其在易用性、灵活性和定制化方面做了一个很好的折中,是一个非常适合做行业落地的开源工具。

cffeb5267388a610dedb9f49d944c42b.jpeg

简单来说,PaddleNLP Pipelines 将各个NLP复杂系统的通用模块抽象封装为标准组件,支持开发者通过配置文件对标准组件进行组合,仅需几分钟即可定制化构建智能系统,让解决NLP任务像搭积木一样便捷、灵活、高效。同时,Pipelines中预置了前沿的预训练模型和算法,在研发效率、模型效果和性能方面提供多重保障。

举个直观的例子。

我们可以把语义检索系统抽象为文档解析、语义向量抽取、向量存储、召回、排序5个基础组件,在此基础上,只需串接1个答案定位模型组件即可构成阅读理解式问答系统。若更进一步,在问答流水线的起点和终点分别加入 ASR(语音转换文本)和 TTS(文本转换语音)2个模型组件甚至可以构成智能语音客服系统,如下图所示。

1d49e81a751e0e207e1107f87d7679d1.gif

而Pipelines就实现了上图一样轻松灵活的开发模式,可将AI模型的上线周期缩短百倍以上。

需要注意的是,在 Pipelines 背后,不仅有 PaddleNLP 提供的强大模型生态(包括刷新中文小模型 SOTA 的文心 ERNIE 3.0轻量级模型),而且该框架兼容了飞桨生态下的任意模型、AI开放平台算子、其它开源项目如 Elasticsearch 等,从而实现任意复杂系统的灵活定制开发。

可以说,Pipelines在灵活易用的基础理念下,又给用户预留了足够的定制化空间,使得用户在面对奇奇怪怪的业务场景疑难问题时,不至于被平台功能给限制。

因此,在Pipelines的生产力赋能下,快速开发一个高精度的金融智能客服FAQ智能问答系统就非常容易了。

4abadf0fd17a1e271bdee28c2c9cab54.gif

同样的方式,我们可以面向金融行业快速开发一个信息抽取模型,来快速落地文首提到的“上市公司公告风险事件提取”、“合同关键信息抽取”等金融业务场景。在信息抽取方面,Pipelines则内置了百度的UIE通用信息抽取技术,其通过多任务统一建模大幅降低了模型开发成本和部署的机器成本,并具备突出的小样本学习能力。例如,在金融领域的事件抽取任务上,仅仅标注5条样本,F1 值就提升了25个点!

7c00c41067f231957eac0b8fc43bf35d.png

也就是说,基于Pipelines开发强大的业务模型并不需要用户有非常丰厚的AI优化经验,Pipelines已经为各大技术场景预置了先进的模型和开发范式,做到了“上手即SOTA”的开发体验,并提供强大的二次开发能力。

总之,PaddleNLP Pipelines不仅大幅提升了行业AI模型的开发和上线效率,大大降低了AI的落地门槛,且内置了当下前沿的NLP技术和模型,兼具易用性、灵活性和专业性,无论是专业的AI从业人员还是行业开发人员,均能快速驾驭,可以称之为NLP技术落地传统行业的开发神器。

PaddleNLP 项目地址:
https://github.com/PaddlePaddle/PaddleNLP/tree/develop/pipelines/examples/FAQ
RocketQA 项目地址:
https://github.com/PaddlePaddle/rocketqa
TrustAI 项目地址:  
https://github.com/PaddlePaddle/TrustAI

最后,百度飞桨&智能云发起的智慧金融直播正在进行中!感兴趣的小伙伴,不要错过哦。 

传送门(如果已经在前面扫码,则报名成功,无需重复扫码):

96ef2a1b2c6d282045abcf21828783c3.jpeg
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值