LLM+RAG:大模型在金融场景的落地探索

e9f6f4455425a0ed2cb8cd75497b52c5.jpeg

如何撞破金融大模型落地的天花板?

RAG、Agent怎样应用?

因果推断、Uplift模型仍然发挥作用?

最新的大数据和数据治理实践?

金融公司数智化三部曲是什么?

8月31日,09:00-17:00,DataFun将联合业内多位知名专家举办DataFunSummit2024:数智金融技术峰会,并和大家一起探讨大模型领衔的数据和智能技术的最新态势,分享各自的研究成果与实践经验,共同推动大模型及相关技术在金融领域的深入应用。感兴趣的小伙伴欢迎识别二维码免费报名,收看直播:

97997ea780d5b6c92788b084b0e80aff.png

扫码免费报名,收看直播

峰会日程

36957f392e20bdbd7b2db150fca3f89c.png

650daa39b4db3065ef1e1d6cca33c35e.png

论坛日程

2c97223e6bd68ef1a36bb5ff820c7675.png

9ce77c667ba671e9b1354f39b8dbaf71.png

27afe197c17d7df7af31d4a65bcd1ffd.png

7d7384bb6a24d486a30249236b464fcf.png

5d3643db23a3553ae04bd9d542dc7697.png

869c958a7b24784a142f86cbf59027fe.png

详细介绍

① 智能金融前沿技术论坛

出品人:陶万杰 马上消费金融 算法副总监

个人介绍:现任职于马上消费金融人工智能研究院,主要负责电销智能决策业务和企业数字化办公智能化等相关的 AI 大模型技术的研发落地。曾任职于阿里巴巴,在智能营销决策算法,运筹学及商业化算法方面带领团队在技术领域深挖探索,沉淀了较多领先技术,近年来研究的相关创新算法技术在 AAAI、CIKM、SIGIR、WWW、KDD、ICDE、VLDB 等 CCF-A 顶会录用 10 余篇,申请多项专利,并多次受邀在公开技术论坛和峰会分享相关技术实践经验。

王心怡 马上消费金融 算法工程师

个人介绍:王心怡,现就职于马上消费的算法工程师一职,本科毕业于天津大学信息管理与信息系统专业,硕士清华大学物流工程,目前主要研究兴趣在因果推断、运筹优化领域。

演讲题目:基于树模型的 Uplift 模型在金融场景的实践

演讲提纲:

1. 引言

- 介绍马上消费金融公司的背景和业务概况。

- 阐述电话营销在金融领域的重要性。

- 提出问题:在什么时间段拨打电话能够最大化客户接通率

2. Uplift模型概述

- Uplift模型的基本原理与概念介绍。

- Uplift模型与传统预测模型的区别:不仅预测响应,还量化干预效果。

- 树模型在Uplift建模中的应用:如Causal Forest, Uplift Random Forest等。

3. 基于树模型的Uplift模型在电话营销中的应用

- 现有问题:电话营销的时间段选择如何影响客户的接通率。

- 解决方案:使用树模型的Uplift模型进行因果推断,确定最优拨打时间段。

- 数据处理和特征选择:包括客户历史行为数据、个人特征数据。

- 模型训练和验证:使用历史电销数据进行模型训练,使用部分数据验证模型效果。

听众收益:

1. 理解Uplift模型的基础知识及其在金融领域的应用场景

- 了解Uplift模型的原理及其相较于传统模型的优势。

- 掌握如何利用Uplift模型来优化营销决策。

2. 学习基于树模型的Uplift模型在电话营销中的实际应用

- 通过具体案例,理解如何使用数据驱动的方式优化营销策略。

- 了解模型开发过程中可能遇到的挑战及应对策略。

3. 获得提升电话营销效果的实用方法

- 学习如何通过数据分析和模型应用提升营销效果。

- 掌握在营销策略中使用Uplift模型的实际操作技巧。

落地挑战和方案重点:

1. 高质量营销数据的收集与处理

- 数据的时效性和准确性。

- 数据量大且分散,如何确保数据一致性。

2. 模型在实际应用中的稳定性和泛化能力

- 如何在模型开发和部署中保证稳定的效果。

- 应对不同客户群体和不同时段的模型表现差异。

沈豪鑫 马上消费金融 算法工程师

个人介绍:现就职于马上消费金融股份有限公司-人工智能研究院决策智能部算法工程师,从事方向为用户需求预测、图像处理等。

演讲题目:扩散模型在金融领域中的应用——需求预测

演讲介绍:一份精准的名营销单可以确保业务人员将时间和精力投入到潜在的、感兴趣的客户上,提高销售效率和转化率。通过对用户的基本属性和历史行为数据建模,可以实现对用户需求的预测,以筛选优质的营销名单。面对金融样本分布不均问题,采取生成式模型来扩充训练样本。此外,还探索使用图像处理技术对用户未来的需求趋势进行预测,以实现更加精准的营销。

演讲提纲:

1. 研究背景与介绍

· 扩散模型的原理与发展

· 金融领域中需求预测的重要性

2. 基于样本增强的需求预测建模

3. 基于图像处理的需求预测建模

4. 模型的优缺点以及后续的优化方向

听众收益:

1. 了解扩散模型的基本原理

2. 学习如何通过原始样本改造实现扩散模型的建模

3. 探索图像处理技术在金融需求预测中的创新应用

落地挑战和方案重点:

1. 样本预处理流程复杂

2. 模型推理速度慢

史春奇 太保科技 数据专家

个人介绍:史春奇博士,毕业于日本京都大学,现为太保科技数据专家, 具有多年以上机器学习、大数据分析的经验。曾任香港交易所创新实验室架构师。著有《机器学习:算法背后的理论与优化》一书。

演讲题目:AI 求解偏微分方程在金融领域的应用

演讲介绍:AI 求解偏微分方程是 AI4Science 的重要分支。偏微分方程求解在金融领域应用比较多,而 AI4Science 的发展给这方面应用带来了全新的机遇。

演讲提纲:

1. 偏微分方程在金融领域的应用

2. AI4Science 与偏微分方程求解

3. 物理信息神经网络与偏微分方程求解

4. 随机偏微分方程求解

5. AI 求解偏微分方程发展展望

听众收益:

1. 偏微分方程与金融领域的关系?

2. AI 发展为偏微分方程求解带来什么机遇?

3. AI 求解偏微分方向要注意什么?

落地挑战和方案重点:AI 求解随机偏微分方程的难点与解决思路

郑妍妍 马上消费金融 算法研究员

个人介绍:在互联网从业10年,先后就职过百度、蚂蚁金服、马上消费金融等公司。在阿里工作5年,担任算法专家,从事金融营销推荐相关算法工作。在马消担任算法研究员,从事营销时机挖掘等相关算法工作。

演讲题目:金融场景下的用户营销时机挖掘

演讲介绍:在对用户进行主动营销时,有效的触达方式包括电话、短信、Push 等。这些方式都涉及触达时机挖掘,以便更好地实现用户转化。在具体方案选型时,涉及冷启动时不存在无偏数据的情况下如何建模时机增益,以及存在随机触达情况下如何建构增益模型等挑战。本次演讲以偏好建模应用冷启动阶段的挑战,以及构建时机 Uplift 建模在更准确数据集上进行营销时机挖掘。

演讲提纲:

1. 金融场景下的用户营销时机业务介绍

· 营销时机的业务场景有哪些

· 为什么做营销时机挖掘

· 营销时机的问题定义

2.时机偏好建模

· 营销时机冷启动难点

· 2.2 上下午偏好建模方法

· 小时偏好建模方法

3.时机增益建模

· 深度学习 Uplift 建模方法介绍

· 时机 Uplift 建模方法

4.模型优缺点及后续优化方向

听众收益:

1. 了解金融场景下的用户营销时机场景

2. 了解深度学习 Uplift 建模方法

3. 学习如何冷启动建模营销时机场景

4. 学习如何使用深度学习 Uplift 建模营销时机场景

落地挑战和方案重点:

1. 冷启动时不存在无偏数据,线上的实际数据受到业务干扰

2. 偏好模型涉及统计数据缺乏,只能针对部分用户建模

3. 存在随机时刻触达数据时,并不像传统的 Uplift 问题,不存在实际上的对照组,如何建构 Uplift 模型

14f051f3b7dd3f09e687ffb4956b3a0a.png

扫码免费报名,收看直播

② 金融大模型落地论坛

出品人:王健宗 中国人工智能开源软件发展联盟副理事长

个人介绍:王健宗,美国佛罗里达大学博士后,华中科技大学与莱斯大学的联合培养计算机博士,现任平安科技副总工程师、智能金融前沿技术研究院院长,中国人工智能开源软件发展联盟副理事长,中国计算机学会大数据专家委员会委员、杰出会员,广东省计算机学会区块链专委会委员,深圳市领军人才,高级工程师等。专注于大模型、具身智能、联邦学习和人工智能在金融、城市、医疗等领域的研发工作,发表联邦学习、深度学习、云计算、大数据等领域国际论文200余篇,专利500多项,著作4本,同时也是多届国内外知名人工智能和大模型会议出品人。

武执政 香港中文大学(深圳) 副教授

个人介绍:武执政博士现任香港中文大学(深圳)副教授、博导,港中大深圳-趣丸科技联合实验室主任。入选国家级青年人才,连续多次入选斯坦福大学“全球前2%顶尖科学家”、爱思唯尔“中国高被引学者”榜单。他于2015年获得南洋理工大学博士学位,并在Meta(原Facebook)、京东、苹果、爱丁堡大学、微软亚洲研究院等机构从事学术研究和技术领导工作。武博士带领开发了语音合成开源系统Merlin、Amphion及开源数据库Emilia,发起并组织了第一届声纹识别欺骗检测国际评测、第一届语音转换国际评测,组织了2019年语音合成国际评测(Blizzard Challenge 2019)。曾获得INTERSPEECH最佳学生论文奖、亚太信号与信息处理协会年度峰会最佳论文奖。武博士现为IEEE语音与语言处理技术委员会委员,语音领域权威期刊IEEE/ACM Transactions on Audio, Speech and Language Processing的Associate Editor, IEEE Signal Processing Letters的Associate Editor, IEEE Spoken Language Technology Workshop 2024的大会主席。他曾受邀在ICASSP、IJCAI 2023 DADA Workshop等权威学术会议做特邀报告。

演讲题目:语音生成大模型

演讲介绍:语音包含丰富的信息,它不仅仅局限于传达的具体文字内容,还囊括了副语言和环境信息。这些信息明确地告知我们 “谁在说、怎么说、在哪说”。在当今大模型飞速发展的时代,如何让语音交互系统更加拟人化、更具表现力已然成为当前的研究热点。而 ChatGPT-4o 无疑是这一领域的典型代表,它为语音交互系统的发展树立了新的标杆。本报告将深入探讨面向语音交互的语音理解与语音生成大模型的前沿进展及技术趋势。本报告将详细剖析典型技术方案,解读其背后的核心原理和创新之处。同时,还会对开源系统与数据进行全面梳理,为广大研究者和开发者提供宝贵的资源和参考。此外,还将通过效果展示,让大家直观地感受语音生成大模型的前沿进展。

霍亮宇 度小满 AI算法研究员

个人介绍:7博士毕业于北京航空航天大学,博士期间主要从事深度强化学习、模仿学习研究工作,相关研究成果发表在TPAMI、TCOM、AAAI等国际知名期刊和会议。博士毕业后进入度小满和中科院自动化所联合培养的博士后工作站,主要从事AI算法研发工作。工作期间主要负责轩辕金融大模型的强化对齐工作。构建了完善的RLHF训练框架,重点突破奖励模型存在的问题与难点,通过强化训练改善轩辕大模型的有用性、安全性和金融能力,显著提高与人类价值观的对齐程度。

演讲题目:金融大模型训练与对齐技术探索

演讲介绍:近年来,大语言模型已逐渐成为AI领域的研发热点。通过增加模型尺寸,并使用海量数据进行训练后,模型可获得各项知识并展现出了较强的通用能力,包括知识、理解、逻辑推理等。大语言模型有望为金融行业创造新的价值增量。然而在实践中我们发现目前的通用大语言模型难以胜任金融任务,其仍欠缺专业的金融知识,金融能力也不能满足金融任务的需求。此外通用大语言模型的训练和部署成本极高,这给其在金融领域的应用落地也带来了一系列挑战。为了解决这些问题,我们研发了金融领域的轩辕大模型。通过补充大量的高质量金融数据并采用一系列创新性做法对大模型进行预训练和SFT,显著提升了大模型金融知识和金融能力,同时保证了模型的通用性。在此基础上,我们通过RLHF技术进一步对齐了模型价值观与人类偏好,在保证金融能力的同时,减少潜在的安全性风险,显著提升了模型体验。

我们先后研发并发布了6B、13B和70B的轩辕金融大模型,在一系列测试基准中表现优异,覆盖了不同模型尺寸范围,构建了完整的大模型能力矩阵。本次分享主要介绍轩辕大模型研发过程中采取的相关技术,包括预训练、SFT、偏好奖励训练及RLHF等。此外也会介绍轩辕大模型的开源情况及其在金融业务中的应用落地情况。主要内容包括:

1. 从通用大模型到金融大模型的挑战

2. 度小满轩辕大模型的诞生之路

3. 金融大模型的训练与对齐经验探索

4. 金融大模型的落地与展望

听众收益:

1. 金融大模型训练过程

2. 大模型对齐的方法与经验

3. 金融大模型落地案例

落地挑战和方案重点:

1. 高质量金融数据的收集

2. 应用场景下的稳定性保证

张恺 东方财富 人工智能研究院 技术科研负责人

个人介绍:专注人工智能及大数据领域研究15+年,在东方财富/携程/优刻得等多家知名企业从事相关技术研发与团队管理工作,对大模型预训练及评测,互联网个性化推荐及广告算法服务有深入研究和实践,尤其在金融、旅游、AI领域有多项研究与实践,具备多次从零到一构建数据团队或算法团队的经验。

演讲题目:智能金融稳步前行:构建负责任的可信大模型

演讲介绍:在金融领域,人工智能正迅速成为推动行业创新的关键力量,但同时也伴随着大量的安全风险隐患,这无疑对于金融领域是一条严守的红线。本次演讲将深入探讨大型在金融领域的落地难点,并如何通过可信的方法缓解相应难点和挑战。分享将介绍我们选择的方案及其技术亮点。并通过实际案例,展示我们的解决思路和策略,以及这些策略如何有效应对落地挑战,最终实现业务的显著成效。具体内容包括:

1. 业务背景:

① 金融行业的现状与挑战

② 人工智能在金融领域的应用前景

2. 方案选型:

① 为什么选择大模型

② 大模型的技术优势与业务适配性

3. 落地挑战:模型的可解释性与合规性

4. 解决思路:

① 负责任的 AI 实践

② 模型透明度与伦理考量

5. 解决成效:业务流程优化案例

6. 未来规划:技术迭代与创新方向

7. 总结:

① 负责任的大模型在金融领域的长远影响

② 对行业未来发展的展望

听众收益:

1. 了解如何将人工智能大模型技术应用于金融领域,以及其带来的变革。

2. 掌握在金融领域实施可信 AI 的关键原则和实践方法。

3. 获取关于数据隐私保护、模型可解释性与合规性的实际解决方案和案例分析。

落地挑战和方案重点:

1. 数据隐私与安全:介绍如何通过先进的数据加密技术和访问控制来保护用户数据。

2. 合规性:讨论如何确保 AI 模型遵循金融行业的法规和标准。

张海涛 海康威视 金融架构师,国际注册云安全系统认证专家

个人介绍:金融从业10年以上,个人擅长AloT的大数据、流计算、AI人工智能等技术研究,QCon 大数据金牌讲师。Apache Beam 中文社区发起人之一及 ClickHouse Conner。自研大数据技术获得国家发明专利,落地的数智金融项目获得省部级科技进步奖三等奖。

演讲题目:银行快速数智化转型的改革先锋-视频分析大模型技术

演讲介绍:随着近几年经济下行,银行业现金业务线上化,实体网点逐年减少,人力成本的增加,金融机构数字化,国家金融监管局的监管力度加强,未来实体网点数字化、无人化、智能化成为未来的发展趋势。在数字化转型的大浪潮中,怎么解决以上的问题,快速实现稳定全面转型成为新的挑战。

演讲提纲:

1. 银行点、库、楼、房、区 50多种视频分析应用场景的介绍

2. 银行应用场景中需要哪些算法&挑战

3. 遇到的问题怎么去解决&未来发展趋势

听众收益:

1. 全面了解大模型在银行那些场景中应用。

2. 全国百万路视频、BP 级的流数据场景,分析架构怎么去设计?

3. 为什么要用大模型?大模型 NB 在那里?

落地挑战和方案重点:

1. 带宽是视频物联网技术发展的的痛

2. 规则的变化、环境的变化导致应用场景倍增。

eab921a34aef5a5ad6de731df512371f.png

扫码免费报名,收看直播

③ 大数据应用与数据治理论坛

联合出品人:左银康 国信证券 数据治理负责人

个人介绍:本科毕业于华中科技大学,工作以来在股份制商业银行、央企、头部券商等多家大型企业开展数据治理工作,具备在数据标准的建设和应用、数据质量提升、数据资产管理等领域从零建设的实践经验,目前在国信证券负责企业数据治理各方面的工作推进。

联合出品人:董大凡 Airwallex 空中云汇 风控研发经理

个人介绍:董大凡,南开大学计算机应用专业博士,大数据和云原生领域专家。曾就职于雅虎,微软,亚马逊等多家头部互联网公司,现就职于 Airwallex Risk Team。Flink 铁杆支持者,曾在多个公司/团队主导过基于 Flink 解决方案的落地。

田清明 新疆银行 数字化发展部 副总经理

个人介绍:24年银行业信息化、数字化相关工作经验,以国内知名解决方案厂商、知名咨询公司等不同身份长期服务于国有大行、头部股份制银行以及数十家区域性城商行,在银行数字化转型的规划、业务、科技、数据等领域具有丰富的理论与实践经验;同时,作为两家银行数字化转型甲方负责人全面负责全行数字化转型工作。基于丰富的实践经验,为20余家区域性银行开展了授课与转型工作指导;创设了区域性银行数字化转型的方法论体系,独著《区域性银行数字化转型:方法论与实践》一书,已四次印制,得到了行业内数百家银行机构高度认可;受多所985大学多次邀请,为在校研究生、金融机构培训学员等授课“银行数字化转型”课程;具有丰富的课题研究经验,多次以课题研究报告牵头人、撰稿人等角色,带领课题组对监管机构、行业协会安排的课题开展研究工作并在国家期刊发表数篇论文。

演讲题目:中小银行数据治理面临的问题与应对策略

演讲提纲:

1. 中小银行如何理解2018年22号文

2. 中小银行如何理解2022年2号文

3. 中小银行数据治理面临的问题与应对策略

4. 中小银行数据治理持续推进建议

听众收益:

1. 准确理解数据治理与数字化转型的关系

2. 准确理解数据治理与业务发展的关系

3. 持续有效开展数据治理工作的建议

李刘东 蚂蚁集团 数据技术专家

个人介绍:哈尔滨工业大学计算数学硕士专业毕业,先后就职于华为技术有限公司、蚂蚁科技集团,分别从事AI算法、数据开发、数据架构等方面工作。

演讲题目:蚂蚁数科数据治理全景解析与实践

演讲提纲:

1. 数据治理概念与框架

· 数据治理定义

· 数据治理的驱动因素与目标

2. 数据治理实践策略:数据架构、标准与规范、平台与工具、数字化运营

3. 蚂蚁数科数据治理实践

· 分布式数据网格(数据架构)

· OneData数据体系&标准化SOP(标准与规范)

· 资产管理平台&数据融合平台(平台与工具)

· 数据治理工作台(数字化运营)

4. 数据治理的未来趋势:数据治理与AI/ML、创新与挑战

听众收益:根据 Gartner 的数据,到 2025 年,寻求扩大数字业务规模的组织中有 80% 将因不采用现代的数据和分析治理方法而失败。随着企业数字化的不断推进,以及数据资产建设进入成熟阶段,数据治理就成为一个亟待解决的问题。通过本次分享,可以了解到蚂蚁数科目前在数据治理方面全流程、端到端的解决方案,清楚如何从数据架构、平台工具、数字化运营等角度全方位解决数据治理问题。

孙星 恩核 产品研发中心 部门总监

个人介绍:专注数据质量、数据资产质量等数据分析类软件的研发和管理工作十余年。主导企业级数据质量、数据资产质量管理及服务平台的产品研发工作,帮助客户通过工具打造常态化的数据质量监控和管理体系,确保高质量数据的快速生产和管理,加速企业数据价值的变现。

演讲题目:面向金融行业数据质量提升的数据治理落地实践

演讲介绍:根据详尽的实证研究数据分析,绝大多数银行已构建起相对完善的数据质量管理架构及问题应对机制。然而,深入分析发现,目前仍存在问题解决周期长、解决问题难度大、数据质量问题多、质量问题认责难、问题溯源耗时耗力、问题解决重视度不够等一系列尚待克服的挑战与障碍。为解决上述问题,采用“四驾马车”的策略方针,即通过“策略优化(提术)”与“系统联动(联术)”作为直接手段,同时依托于“智能算法(智术)”和“先进技术(技术)”作为核心支撑。这一策略旨在降本提效,助力问题数据解决,提升数据质量。

演讲提纲:

1. 金融机构数据质量问题面临的挑战

· 问题解决周期长

· 问题解决难度大

· 数据质量问题多

· 质量问题认责难

· 问题溯源耗时耗力

· 问题解决重视度不足

2. 金融机构如何建立数据质量问题管理体系?

· 数据质量问题管理组织与职责

· 数据质量问题管理模式构建

· “四驾马车”赋能数据质量问题解决

3. 基于数据质量提升的数据治理落地实践

· 以数据架构为驱动的数据质量管理

· 通过元数据扩展数据质量管理

· 结合数据剖析结果分析问题

· 以主数据出发的数据质量管理

· 依托数据标准智能化推荐

· 以应用场景出发的数据质量管理

听众收益:

1. 了解金融机构目前数据质量问题管理痛点

2. 了解金融机构如何建立数据质量问题管理体系

3. 结合落地实践,了解数据质量问题常见解决方法

落地挑战和方案重点:

1. 高质量数据技术甄别困难

2. 如何量化数据质量整改效果

石磊 金信网银 副总经理

个人介绍:石磊,安徽财经大学情报学硕士,目前任金信网银副总经理,聚焦监管科技在金融风险防控领域的研究应用,牵头负责公安部涉众性经济犯罪大数据监测预警平台、北京市金融局冒烟指数金融风险监测预警平台等重点项目设计建设,曾参与南昌市公安局、亭湖区金融局、中国人民公安大学等多场监管科技应用实践培训。

演讲题目:冒烟指数防控地方金融风险

演讲介绍:应用大数据、人工智能、云计算等监管科技技术,构建冒烟指数及金融风险监测预警系统,对非法金融活动、地方金融组织、重大金融风险等进行监测预警,辅助和提升监管效能,防范金融风险。

听众收益:了解金融风险、地方金融监管、监管科技技术等。

落地挑战和方案重点:如何打通数据壁垒,实现穿透式监管。

792f5c7e0e65ea2cace7af4ef5d40ab6.png

扫码免费报名,收看直播

① 智能生成与辅助技术论坛

出品人:李渔 熵简科技 联合创始人兼CTO

个人介绍:熵简科技联合创始人,清华大学电子工程系博士,已在顶级会议及国际期刊发表18篇学术论文,申请专利10项,长期从事自然语言处理及深度学习与金融资管领域的交叉研究和应用探索,让科技赋能产业。目前负责熵简科技NLP技术中台的建设,包括层次化的分层架构、大数据泛采体系、持续部署的后台支持以及前沿算法的领域内落地等,为熵简科技的各大业务线提供底层技术支持和可落地的解决方案。曾获北京市优秀博士毕业生,清华大学优秀博士论文,腾讯云TVP专家等荣誉。

演讲题目:面向金融资管场景的 RAG 体系建设和落地实践

演讲介绍:大语言模型(LLM)在落地到金融资管场景时存在三方面的不足,包括无法提供及时信息、生成内容可能存在幻觉、金融专业深度不够,这大大限制了 LLM 在金融这类高实时性、高准确度场景上的落地效果。在本次演讲中,我们将分享熵简科技如何基于多年的金融数据治理经验和自然语言处理的积累,去构建专门面向金融资管场景的 RAG 体系,用以协同LLM解决上述三类问题。整个 RAG 体系包含识别率高达95%以上的PDF解析引擎、超长文档语义分割引擎、召回效率强于其他向量化模型50%的 FinBERT2模型以及检索效果高出OpenAI embedding 30%的FinSearch 语义检索引擎四大核心组件。整个 RAG 系统能够在 2000万数量级的金融文档上实现 97% 的检索召回率,辅助 LLM 在个股洞察、宏观研究、行业分析等方向接近初中级投研分析师水平,并逐步将LLM的服务能力向机构服务端、财富管理端演进。

演讲提纲:

1. 大语言模型在数智化金融资管系统建设上的典型需求和主要挑战

2. 熵简科技构建的面向金融资管场景的 RAG 体系及落地案例

3. RAG 体系的关键组件:三阶段训练而成的金融专属向量化模型 FinBERT2

4. RAG 体系的关键组件:打造接近人找资料能力的高性能检索系统

听众收益:

1. 了解大语言模型在数智化金融资管系统建设上的典型场景和主要挑战;

2. 了解如何通过领域内海量数据的预训练结合对比学习,构建明显优于当下最好开源向量模型以及闭源向量模型的向量化模型;

3. 了解如何通过构建千万级文档下超高召回率的检索系统;

落地挑战和方案重点:大语言模型(LLM)在落地到金融资管场景时存在三方面的天然不足,一则由于知识存在模型权重中且很难做到高频训练,因此无法提供及时的资讯;二则,当前阶段LLM无法完全抑制幻觉,这无法满足金融资管对于高准确性的要求;三则在金融专业度不够。

张庆 东方证券 算法工程师

个人介绍:张庆,博士在东方证券任职期间,负责公司内金融行业AI前沿技术的探索与研究,在券商自营、债券营销、财富管理等多个领域结合业务痛点成功落地和主持多个业务项目,拥有丰富的金融行业智能算法研究与模型设计经验。相关项目和课题曾荣获2023年上海青年金融业务创新大赛二等奖,2021年证券业协会优秀课题奖、深交所金融科技优秀课题、上海市企业管理现代化创新成果二等奖、第二届 NIFD-DCITS 金融科技创新案例等。

演讲题目:大语言模型在投研投顾中的应用与难点

演讲提纲:随着去年年初开始大语言模型的火热,金融领域中使用大语言模型构建应用辅助开展业务实现降本增效得到了广泛的关注,本次分享以大语言模型在投研投顾场景中如何应用,分析其实践过程中大语言模型应用的难点为切入点,讲述如何通过检索增强构建有效投研投顾应用,技术的适用范围及相关技术的未来展望。

听众收益:

1. 了解大语言模型在实际金融场景中应用时存在的问题

2. 在构建或选择 RAG 时,为什么效果不佳及如何改善

落地挑战和方案重点:

1. 基线 RAG 在长程关联和总结类问题上无法支持

2. 各类文档与检索要求的不同导致 RAG 定制化程度过高

王永合 平安壹钱包 大数据研发部算法负责人

个人介绍:2021年入职平安集团,现任平安壹钱包大数据研发部算法负责人。主要致力于大数据算法研发、工程落地、平台化建设等方面探索,先后负责推荐系统、实时推荐算法、大模型平台建设,并从0到1建设了智能风控运营的全生命周期闭环。

演讲题目:AIGC 辅助账户风险管理

演讲介绍:在金融科技的浪潮中,账户风险管理一直是金融机构关注的焦点。传统的人工驱动流程在处理复杂的欺诈案件时,不仅耗时且容易出错。随着大模型技术的兴起,我们有机会通过智能化手段,提高风险感知和风控决策的能力,从而降低人工失误率,提升运营效率。本次演讲将深入探讨如何利用大模型技术,实现账户风险管理的数字化转型,以及这一转型如何为金融机构带来实质性的价值。

演讲提纲:

1. 传统账户风险管理的流程与挑战

2. 总体目标与方案思路

3. 应用场景介绍

4. 案件风险点诊断

5. 电话照会剧本生成

6. 管控建议及案件小结生成

7. 后续规划

听众收益:

1. 对大模型技术在账户风险管理中应用的全面理解

2. 掌握如何通过数字化手段提升风控效率和准确性

3. 了解大模型技术在不同风险管理场景下的实际应用案例

4. 学习如何构建和优化风控策略,以适应不断变化的市场环境

5. 认识到大模型技术在金融科技领域的创新潜力和业务普适性

6. 洞察大模型技术如何帮助金融机构降低成本、提升服务质量,并增强竞争力

落地挑战和方案重点:

1. 目前对大模型的标注结果需要人工介入一一排查, 这一环节效率比较低,可进一步优化

2. 风控领域的风险是与时俱进的,但我们目前还无法做到自动化的感知新的风险点,还需要依赖运营人工进行总结并主动创建 workflow,并定期进行维护,实时性不高,且比较费人工

95d6d5dbba099335f07cb137816703a2.png

扫码免费报名,收看直播

② 智能营销论坛

出品人:方涛 蚂蚁集团 高级算法专家

个人介绍:蚂蚁数科营销算法负责人。在蚂蚁从事金融智能化十年,专注于智能营销、用户增长、多模态等算法方向,曾负责保险用户增长、平台营销、刷脸支付等方向。

马琼旭 网商银行 高级算法专家

个人介绍:负责网商渠道营销智能化建设,先后负责整合营销、端外渠道拓展、全渠道运筹等流量建设项目,打造智能出价、序列投放等底层算法能力。先后主导参与多篇国际学术论文工作,接受CCF-A/B论文8篇,相关专利11篇。

演讲题目:金融流量营销中的算法应用

演讲介绍:介绍金融类产品在流量营销中涉及的主要问题与相关算法解决方案,围绕背景、挑战、算法问题定义与解决方案展开,进行框架式介绍。

演讲提纲:

1. 金融流量营销场景介绍

2. 场景中分别涉及的算法需求&挑战

3. 算法(多目标、因果)解决方案与未来探索方向

听众收益:

1. 了解数智能力在金融产品营销中的实际业务

2. 了解相关业务中涉及的算法应用

落地挑战和方案重点:

1. 数据稀疏与有偏

2. 场景多业务多,算法成本高

徐哲轩 蚂蚁集团 高级算法专家

个人介绍:蚂蚁集团保险营销策略与财产险算法负责人,主导蚂蚁保用户洞察,AIGC,营销定价等能力建设。曾在海外大厂从事推荐和搜索工作。

演讲题目:AIGC 在保险领域的应用探索

演讲提纲:本次分享介绍了蚂蚁保险在不同素材的AIGC应用能力尝试,即涵盖20字以内的短文本和百字的长文本,也包括复杂的营销卡片和视频。同时,为了发挥GC素材的规模化能力并提高素材营销效率,我们在整条链路迁入了个性化能力,在生产时就针对不同用户提供匹配的素材承接,做到千人千面的能力。

听众收益:可以了解到大模型在特定领域的应用,以及在落地过程中如何进行质量控制和规模化推广。

郑光煜 蚂蚁集团 高级算法工程师

个人介绍:郑光煜,现任蚂蚁集团财富技术部高级算法工程师,复旦大学硕士,主要研究方向为推荐系统、迁移学习、表示学习、自然语言处理等,曾在 ICLR、EMNLP 等国际顶级会议发表论文。

演讲题目:跨域多目标 Ranking 在金融营销领域的应用

演讲提纲:

1. 解决什么问题

2. 跨域多目标推荐的技术原理

3. 实际案例:结合真实业务场景理解技术应用的细节与挑战

4. 解决思路

听众收益:

1. 跨域多目标推荐模型的发展历程

2. 在金融营销领域对于跨域推荐的技术思考与落地实践

3. 多目标 Ranking 的落地实践

周伟鹏 数禾科技 AI 实验室算法专家

个人介绍:数禾 AI 平台负责人,开源金融工具包 toad 作者,从事多模态、大模型 AIGC 相关研究工作。

演讲题目:AIGC 辅助营销素材生成

演讲介绍:营销素材的在获客投放中起着非常重要的作用,我们尝试通过 AIGC 技术的应用,来提升营销素材的质量与数量,同时结合业务数据,自动化分析产出热门风向,指导新一轮素材产出。

听众收益:

1. 了解金融行业营销素材特点

2. 了解 AIGC 在金融营销的应用场景

3. 了解 AIGC 在落地过程的实践问题

落地挑战和方案重点:

1. 能产出的素材类型有限,如情景剧类型素材暂无方案

2. 创新型素材难以提取与产出

6971877332664baa5b710560d24393f8.png

扫码免费报名,收看直播

③ 金融数智化转型论坛

出品人:王超伦 中国信息通信研究院 云计算与大数据研究所 数据智能应用方向高级业务主管

个人介绍:于中国信息通信研究院云计算与大数据研究所从事数据智能方向标准化工作。

王卓 中国信息通信研究院 云计算与大数据研究所 大数据与智能化部高级业务主管

个人介绍:中国信通院云计算与大数据研究所大数据与智能化部高级业务主管,长期从事数据智能领域相关标准、政策和产业研究等工作。牵头制定完成20余项数据智能领域行业、团体标准,深度参与各年度《大数据白皮书》编写工作,牵头编制《数据智能白皮书》、《数据中台实践指南》等研究报告,牵头制定《企业数智化能力成熟度模型(EDMM)》系列标准,续推动面向应用方的企业数智化能力成熟度评估工作,具有丰富的产业研究、标准编制、评估及咨询经验。

演讲题目:企业数智化能力成熟度模型(EDMM)标准体系解读

演讲介绍:在当前技术背景和经济背景下,数智化转型成为多数企业提升自身竞争力的重要手段。面向企业数智化转型过程中可能会遇到的问题,中国信通院联合业界启动《企业数智化能力成熟度模型(EDMM)》系列标准,形成一套面向应用方企业的数智化能力框架体系,指导企业对照标准规划能力建设,并进一步通过成熟度评估以评促建,助力自身数智化转型顺利进行。本次分享将对EDMM系列标准进行系统性介绍和解读。

演讲提纲:

1. 数据智能背景

2. 企业数智化能力框架体系

3. 数智基础设施

4. 数智中台

5. 数智应用

6. 数智化转型长效机制

7. EDMM 系列评估

听众收益:

1. 了解数据智能的发展背景,以及数智化转型对企业的作用

2. 了解企业数智化能力的基本框架体系,详细了解各方向能力,为数智化转型的开展储备方法论

范彬彬 外资行 大数据研发团队负责人/数据专家

个人介绍:范彬彬,目前负责外资行的数据底座平台建设、数据应用(营销、运营,风险)规划与建设、数据治理的工作。7年以上从事银行金融科技开发、管理工作,具备头部股份制银行、外资银行的从业经验。熟悉银行电子渠道、支付、信贷风控贷后管理全流程、银行核心总账、监管报送、开放银行平台等从0到1的完整落地建设经验,丰富的银行应用系统架构规划经验。

演讲题目:中小银行大数据应用实践

演讲介绍:本次演讲重点介绍中小银行大数据探索建设之路,在知中行,在行中知。基于数据质量,数据开放,数据开发等多重痛点之下,可控的成本投入的基础之上,完成数据智能应用建设和推广。

演讲提纲:

1. 建设背景与目标

2. 大数据平台的整体规划与架构

3. 大数据智能应用落地实践的思考

4. 建设效果和战略延续

听众收益:在面对成本和效率等多方因素下,中小银行探索出一套切实可行,经验可复制的大数据平台和应用落地的最佳实践。(仓湖一体、银行数据建模、数据智能化应用)

落地挑战和方案重点:

1. 数据质量管控

2. 数据开放能力

3. 数据开发管理

李兴泉 平安人寿 数据专家

个人介绍:李兴泉,平安人寿,数据专家。十年的大数据实践经验。

演讲题目:保险业的在数字化转型上的赋能探索实践

演讲介绍:近两年来,平安人寿在数字化转型上积极探索,业数研一体的要求愈趋强烈,对于如何融合给我们带来很大的挑战,都在摸着石头过河,而作为数据研发方面探索出一条提升业务高质量效能的路。

演讲提纲:

1. 介绍数据化转型背景

2. 数据分析赋能可行性

3. 数据分析方法论

4. 实践案例

5. 期望和挑战

听众收益:

1. 可以了解金融业对于业务赋能方面的尝试和实践

2. 数据分析如何在业数研方面的方法和思路

落地挑战和方案重点:在主动赋能业务过程中,如何从上到下业数研融合促进目标达成。

王东风 中电金信 数据智能部 人工智能负责人

个人介绍:先后任职金融创业公司、金山云、中国系统,现在担任中电金信数据智能部人工智能负责人,具有丰富的数据智能、人工智能和大模型相关技术和方案经验,参与大量银行和财务公司项目,曾发表过多篇SCI论文和专利。

演讲题目:财务数据智能监督方案构筑国央企风控堡垒

演讲介绍:国资委重点发布融资性贸易检查和央国企财务风险监督要求,结合财务公司和外部工商类数据,采用数据分析、机器学习、深度学习和知识图谱等技术发掘融资性贸易、虚假贸易等风险事件,有效地实现事前预防、事中监控、事后监督的全生命周期管控。

演讲提纲:

1. 业务背景

2. 方案总体架构

3. 重点监督主题构建

4. 数据智能模型:交易风险预警模型,企业挂靠分析模型,知识图谱赋能企业风险挖掘;

5. 未来规划(大模型智能监督应用)和总结

听众收益:

1. 财务数据智能的应用价值;

2. 数据智能赋能央国企财务风险监督的方法;

3. 财务监督管理的发展趋势。

落地挑战和方案重点:知识图谱在外部关联链条缺失的情况下,如何挖掘风险事件。

黄兆云 重庆银行 金融科技高级经理

个人介绍:黄兆云,目前主要负责数据架构规划工作,包括数据治理与数据中台服务体系规划等方面,牵头大数据应用和数据资产运营体系建设工作,多次主持课题研究并荣获DAMA中国数据治理实践创新奖等荣誉。

演讲题目:数据中台服务体系建设实践

演讲介绍:本次演讲主要介绍重庆银行数据中台服务体系建设实践经验及成效总结。在银行业数字化转型的背景下,数据是驱动商业银行高质量发展的核心生产力,中小银行如何在成本和风险可控的前提下建设适合本行的数据中台服务体系,重庆银行通过自身探索实践提供了可供借鉴的途径。

演讲提纲:

1. 数据治理探索之路

2. 数据中台体系规划

3. 数据中台体系建设实践

4. 数据中台应用成效

5. 工作展望

听众收益:了解重庆银行数据中台服务体系建设实践经验总结和路径选择,为中小银行如何建设适合本行的数据中台服务体系提供参考。

落地挑战和方案重点:

1. 如何平衡数据中台建设周期长和及时响应业务需求之间的矛盾

2. 如何解决数据中台体系内部各模块标准化建设的问题

59aa1100a64aa135cea28528471c3550.png

扫码免费报名,收看直播

31624be11951c098238270cbb07ad0bd.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值