2024-arXiv-FinRobot: 一种基于大语言模型的开源金融应用 AI 智能体平台-CSDN博客

本文链接：https://blog.csdn.net/m0_59082437/article/details/145691263

arXiv | https://arxiv.org/abs/2405.14767

GitHub | https://github.com/AI4Finance-Foundation/FinRobot

摘要：

随着金融机构和专业人士越来越多地将大语言模型（LLMs）纳入其工作流程中，金融领域与人工智能社区之间依然存在显著障碍，包括专有数据和专业知识的壁垒。本文提出了 FinRobot，一种支持多个金融专业化人工智能智能体的新型开源 AI 智能体平台，每个代理均由 LLM 提供动力。具体而言，该平台包含四个主要层次：1）金融 AI 智能体层，通过将复杂的金融问题分解为逻辑序列来形成金融链式思维（CoT）；2）金融 LLM 算法层，动态配置适用于特定任务的模型应用策略；3）LLMOps 和 DataOps 层，通过应用训练/微调技术并使用与任务相关的数据来生成准确的模型；4）多源 LLM 基础模型层，整合各种LLM，使上述各层能够直接访问这些模型。

一、引言

金融分析通常涉及解读市场趋势、预测经济结果并提供投资策略，先于金融决策。股票分析可以分为两类，基本面分析研究公司并给出估值，而技术分析则研究市场行为以预测未来价格走势。

基于大语言模型（LLMs）的基础，智能体已经发展出利用这些模型执行一系列复杂功能的能力，包括计划、内存管理以及工具使用。最近的人工智能智能体应用，例如用于交易的 FinAgent 和用于金融决策的 FinMem，突显了这些技术在执行复杂金融操作方面日益增长的依赖性。尽管这些技术取得了显著进步，但仍存在若干关键挑战未得到解决：

**透明度提升：**AI 智能体驱动的金融分析平台可以通过何种方式改进其决策过程的透明度，以增强用户信任？
**全球市场适应性：**AI 智能体如何有效适应全球股票市场的多语言和多元文化特征，以确保全面和准确的市场分析？
**模型多样性：**仅依赖单一的 LLM 架构（如 GPT-4）进行复杂金融分析存在哪些局限性？如何通过多样化模型架构提升性能？
**实时数据处理：**AI 智能体平台如何高效管理和路由大量金融数据，以确保及时和精确的金融分析？

本文提出了 FinRobot，一种利用多源 LLM 进行各种金融任务的开源人工智能智能体平台。FinRobot 优化了从数据处理到策略实施的金融工作流程，扩大了高级分析工具的访问范围，增强了可扩展性和透明度。

二、FinRobot：一个开源金融任务平台

FinRobot 的整体框架组织成四个不同的层次，每个层次都旨在解决金融 AI 处理和应用中的特定方面：

金融 AI 智能体层：包括金融思维链（CoT）提示，增强了复杂分析和决策能力。市场预测智能体、文档分析智能体和交易策略智能体利用 CoT 将金融挑战分解为逻辑步骤，使它们的高级算法和领域专业知识能够与金融市场不断变化的动态相契合，从而获得精确且可操作的洞察。
**金融 LLM 算法层：**金融 LLM 算法层配置并利用专门调整的模型，适用于特定领域和全球市场分析。该层采用 FinGPT 与 **Llama系列（针对美国市场）**和 **ChatGLM（针对中国市场）**等多源 LLM 相结合，每种模型都经过优化以适应区域特定性。
- Falcon 模型在金融关系分析方面表现出色。
- 多模态模型将文本与K线图结合。
- FinRL 优化了如资产配置等任务。
- 传统机器学习方法则优化了股票选择。
**LLMOps 和 DataOps 层：**双层配置增强了 FinRobot 在动态市场条件下提供及时和准确金融洞察的能力。
- LLMOps 层采用多源集成策略，选择最适合特定金融任务的LLM。最初部署通用 LLM；如果性能不佳，系统会动态切换到微调 LLM 以提高效果，确保了针对不同金融场景的定制化解决方案。
- DataOps 层管理实时数据处理，对于快速市场响应至关重要。
**多源 LLM 基础模型层：**该基础层支持各种通用和专业大语言模型的即插即用功能。它是平台的核心骨架，确保所有模型都保持最新、优化，并且始终与最新的金融科技和数据标准保持一致。

2.1 金融 AI 智能体层

金融 AI 智能体层包括专门针对增强金融分析而设计的高级数据感知、认知处理和动态行动执行的领域特定 AI 智能体：

**感知模块：**通过使用复杂的技术从市场数据、新闻和经济指标中捕获和解释多模态金融数据，并将数据结构化以进行深入分析。
**大脑模块：**作为核心处理单元，利用大型语言模型（LLMs）感知来自感知模块的数据，并运用金融思维链（CoT）过程生成结构化的指令。
行动模块：执行大脑模块生成的指令，利用工具将分析洞察转化为可操作的结果，包括交易、调整投资组合、生成报告或发送警报，从而积极影响金融环境。

2.1.1 多智能体工作流

在处理复杂金融数据集并确保高水准的分析准确性和深度方面，部署多智能体工作流系统具有显著优势。该系统集成了多个专业角色，这些角色协同工作，处理、分析并从多种金融数据源中提取可操作的洞察。

**指导：**作为项目的战略领导者，负责监控工作流的所有方面。该角色涉及优先处理金融任务、分配资源以及协调团队努力以优化分析时间线和结果。
**助理：**专注于初始数据管理任务，如收集、处理和进行初步分析，并促进智能体之间的沟通。该角色通过准备数据集、维护数据库以及执行基本的金融计算和可视化来支持更专业的分析师。
**LLM 分析师：**利用先进的计算技术分析金融文本，如报告、提交文件和新闻文章。这一角色对于从定性数据中提取详细见解、进行情感分析以及预测市场趋势至关重要。
**金融分析师：**在 LLM 分析师的指导下，针对各种领域（如投资组合管理、风险评估和市场分析）进行详细的定量数据分析。利用统计工具和金融模型，解释数据、评估投资机会并制定风险缓解策略。

2.1.2 大语言模型（LLMs）工具

**API 交互：**通过 Text2Params 将自然语言查询转换为 API 请求，有效地结合了生成函数调用和形成 API 调用的能力。

LLM 首先解析文本以识别和提取关键参数。
这些参数被用于动态生成函数调用，或者直接编译为与金融软件或数据库交互的 API 请求。

**代码编译：**通过 Text2Code 对于需要动态生成解决方案的更复杂的金融任务，LLM 可以利用 Text2Code 技术即时编写和编译代码，对于根据用户查询的独特市场条件或金融场景开发定制算法至关重要。

2.2 金融 LLM 算法层

金融 LLM 算法层涵盖了专门设计以应对金融领域各种需求的高级人工智能算法，增强了平台在一系列金融应用方面的功能。

2.2.1 FinGPT

FinGPT 是一个金融领域的语言模型，精心设计以在金融背景下提升自然语言理解能力。模型能够熟练地分析和解释金融叙述，从复杂的文件（如年度报告和实时财经新闻）中提取关键数据，从而支持更高效的决策过程。

FinGPT 主要通过在开源大型语言模型上使用金融领域的**“指令-响应”配对数据进行监督微调而开发。这一过程通过最小化以下负对数似然**来实现：
$L_{\text{CausalLM}}=-\sum_{t=1}^T\log P(w_t|w_1,w_2,…,w_{t-1};\theta)$
其中 $T$ 表示输入序列的长度， $w_i$ 表示序列中的第 $i$ 个词元， $\theta$ 表示模型参数， $P(w_i|w_1,w_2,…,w_{i-1};\theta)$ 表示在给定前序词元 $x_1,…,x_{i-1}$ 的条件下预测目标词元 $x_i$ 的条件概率。

通过优化此目标函数，模型能够学会最大化在给定金融任务指令下生成预期响应的概率。

2.2.2 FinRL

FinRL 使用集成深度强化学习算法优化交易策略，以分析历史和实时市场数据。这种动态适应性有助于最大化财务回报的同时最小化风险，使股票投资组合分配成为该方法的理想应用。

在 FinRL 中，股票投资组合分配被建模为马尔可夫决策过程（MDP）：

在任意时间点 $t$ ，一个处于状态 $s_t \in S$ 的智能体根据策略 $\pi_\theta(s_t)$ 选择一个动作 $a_t \in A$ ，该动作导致新的状态 $s_{t+1}$ 和奖励 $r(s_t, a_t, s_{t+1})$ 。目标是优化这个策略：

$\pi_{\theta}^*=\text{argmax}_{\theta}J(\pi_\theta)\\ J(\pi_\theta)=\mathbb{E}[\sum_{t=0}^T\gamma^tr(s_t, a_t, s_{t+1})]$

其中， $\gamma \in (0, 1]$ 是折现因子。

2.2.3 FinML

FinML 利用了从回归到高级神经网络等多种机器学习技术，以增强金融领域的预测分析能力。这些算法在预测市场趋势、消费者行为、信用风险以及其他关键金融指标方面发挥着重要作用，从而促进基于数据的决策制定。

2.2.4 金融多模态大语言模型

金融文件经常包含文本内容之外的多种数据类型，例如图表和表格。这些额外的模态提供了丰富的补充性见解，显著增强了分析的深度。为了有效整合和利用这些多样化的数据类型，我们开发了金融多模态大语言模型，专门设计用于处理和综合来自多种模态的信息，从而提供全面和细致的金融文件理解。

金融多模态大语言模型中整合过程的数学表示如下：
$F(x_t, x_g, x_h) = L(T(x_t), G(x_v), H(x_l))$

其中， $F(x_t, x_g, x_h)$ 表示模型的输出， $x_t, x_g, x_h$ 分别代表文本、图形和表格数据的输入。函数 $T, G, H$ 将这些输入转换为统一的嵌入空间。随后，大语言模型 $L$ 综合这些嵌入，生成一个连贯且可靠的输出，从而提高金融分析的准确性和可靠性。

2.3 LLMOps 层

LLMOps 层旨在实现高度模块化和插件化，能够快速整合和动态更换生成型预训练语言模型（LLM），以应对不断演进的技术进步和金融市场的需求变化。该层支持无缝模型集成，并包括严格的评估和选择机制，以确保为特定的金融任务选择最合适的模型。这些能力对于保持运营效率并确保解决方案对各种金融场景的适应性至关重要。

智能调度器：是确保模型多样性和优化为每项任务选择最合适的大型语言模型（LLM）的核心。

**指导智能体：**此组件协调任务分配过程，确保根据代理的性能指标和特定任务的适用性将任务分配给相应的代理。
**智能体注册：**管理代理的注册和跟踪系统内的可用性，促进高效的任务分配过程。
**智能体适配器：**根据特定任务定制代理功能，增强其性能并促进其在整体系统中的集成。
**任务管理器：**管理和存储适用于各种金融任务的不同通用和微调的LLM代理，定期更新以确保相关性和有效性。

初始化过程：

**黄金数据集创建：**填充行业特定的数据。
**命令存储填充：**填充适用于各种代理的自定义命令。
**任务评分填充：**调用适配器评估响应与最佳答案的匹配度，并将评分存储在任务评分数据库中。

运行过程：

**任务启动：**用户启动任务。
**指导智能体的作用：**评估任务输入，按性能和相关性对代理进行排序。
**智能体选择与任务路由：**将任务路由给排名最高的代理。
**工作流进展与自我评估：**任务完成后，代理进行自我评估，评估结果存储在未来的反思存储中。
**工作流完成与评估：**在工作流结束时，代理评估结果并提供反馈，以实现持续改进。

评分指标：

**数据收集：**收集多种语言模型在多个评估任务中的性能数据。
**标准化：**对每个评估任务的结果进行标准化，使其在0到1之间。
**权重分配：**根据行业标准或专家意见，为不同的评估维度分配权重。
**综合评分计算：**将标准化得分乘以其相应的权重，并求和以得出任务得分。
**结果分析：**分析得分以对语言模型进行排名和评估，提供性能比较和选择建议。

2.4 DataOps 层

DataOps 层管理用于金融分析的广泛且多样的数据集，从公开的表格数据到专有的市场情绪数据。该层对于确保输入到AI处理管道中的所有数据都具有高质量且能代表当前市场状况至关重要。

**检索增强生成（RAG）**巧妙地结合了上下文检索机制和大规模语言模型（LLM）的优势，以优化语言生成任务。

2.5 多源 LLM 基础模型层

多源 LLM 基础模型层为 FinRobot 配备了先进的能力，使其能够管理和整合多种多样的大语言模型（LLMs），这对于适应全球金融市场动态需求至关重要。该层的关键功能包括：

**插拔式功能：**使通用和专门的大型语言模型（LLM）的无缝集成和更新成为可能，确保该平台能够适应并跟上金融科技的发展步伐。
**模型多样性和评估：**涵盖了参数范围从 70 亿到 720 亿的LLM，每种模型都经过严格的评估，以确保其在特定金融任务中的有效性，从而根据诸如准确性和适应性等性能指标进行最优模型选择。
**全球市场兼容性：**支持多语言模型的集成，增强了平台分析和处理多样化的金融数据的能力，这对于全球市场操作至关重要。

三、金融思维链（CoT）提示

思维链提示技术通过结构化提示来促进 AI 模型逐步进行推理过程，类似于人类解决问题的策略。该方法通过促使模型阐述中间推理步骤，从而显著提升了数学和常识推理等复杂推理任务的表现，并增强了决策过程的可解释性和透明度。

金融思维链提示将思维链应用于AI驱动的金融分析中，结合先进的认知处理技术以提升决策能力。该方法通过引导 AI 模型进行逻辑和顺序化的推理过程，将复杂的金融情境分解为更小、更易于管理的部分，对每个部分进行分析，并综合这些发现形成结论或建议。特别适用于需要深入分析的任务，例如估值、投资策略制定、市场趋势分析和风险评估。

**财务分析：**FinRobot 超越了基本的数据罗列和比率计算。通过运用大规模语言模型（LLM）进行财务报表分析，它能够进行跨行业竞争对手的比较分析，并与公司的历史表现进行对比。
**特定业务分析：**利用检索增强生成（RAG），FinRobot 革新了收集公司产品和服务数据的过程。通过利用互联网上的丰富资源，增强了对公司提供的产品和服务的理解能力，使其能够进行全面的产品线分析、不同渠道和地区的趋势分析、成本结构分析、供应链动态分析以及研发转化分析。
**市场分析：**结合财务比率、市场数据、市场新闻情绪以及在线获取的替代数据，运用LLM，FinRobot 模拟了市场参与者在应对情境变化时的决策过程，能够全面评估公司的股价走势和估值，提供细致的投资评估，提供关于最佳投资时机和合适金融工具的战略指导。
**估值分析：**结合财务比率、市场数据、市场新闻情绪以及在线收集的替代数据，运用LLM，FinRobot 使用这些多样来源获得的见解来评估公司的股价走势和估值。

四、Demo 应用与实践教程

4.1 应用一：市场预测器

市场预测器旨在综合近期市场新闻和财务数据，提供关于公司最新成就和潜在关切的全面洞察，并预测股价变动。作为初级自动化顾问，市场预测器在基于AI的财务顾问领域迈出了显著的进步。

数据：

收集有关目标市场的多方面公司信息，如最新新闻、最新基本财务数据和股票价格等信息。
数据来源为 **Finnhub（美国市场）**和 EastMoney（中国市场）。

模型：

微调的 FinGPT-Forecasters 驱动
使用 Llama-2-7b-chat-hf 并结合 LoRA 技术
**微调数据：**利用过去一年道琼斯30指数（美国市场）和上证50指数（中国市场）的数据
采用金融多任务指令微调范式，将基础模型的力量与市场预测器的特定功能相匹配。

提示：

市场预测器收集多维度的公司信息，然后通过提示工程将指令性提示格式化为**“任务指令 & 公司信息（公司概况 + 最近的股票价格 + 最近的新闻 + 最新的基本财务数据）”**的结构。

预测结果：

4.2 应用二：文档分析与生成

文档分析与生成代表了在金融文档管理与报告生成领域中人工智能代理和大型语言模型（LLMs）的一项开创性应用。该应用利用人工智能的力量对金融文档进行深入分析，并自动生成详细且富有洞察力的报告。

**文档分析：**智能体与 LLMs 集成后，被用于筛选大量财务文件，如年度报告、SEC备案文件和财报电话会议纪要。智能体能够提取关键信息，识别重要财务指标，并突出显示可能需要进一步审查的趋势和差异。
**报告生成：**在分析阶段之后，同一智能体被用于生成全面的财务报告。利用LLMs的能力，系统生成连贯、准确且详细地涵盖财务分析各个方面的文档，包括绩效评估、市场比较和前瞻性的财务预测。