“Enhancing Financial Market Predictions: Causality-Driven Feature Selection”
预测股市波动性是金融领域面临的重要挑战,市场的非线性和本质上的波动性使得准确预测市场趋势变得困难。
本文构建了FinSen数据集,将来自197个国家的经济和金融新闻文章与股票市场数据集成,覆盖15年的时间跨度,提供了160,000条金融市场新闻的全球视角。同时提出了一种创新的Focal Calibration Loss方法,将预测概率与实际结果紧密对齐,提高了金融预测的准确性和可靠性。
通过证明情感分数与市场波动之间的因果关系,并将这些因果验证的特征集成到LSTM模型中,本文的模型实现了更细致和可靠的市场预测。
论文地址:https://arxiv.org/pdf/2408.01005
摘要
本文介绍了FinSen数据集,将来自197个国家的经济和金融新闻文章与股票市场数据集成,覆盖15年的时间跨度,提供了160,000条金融市场新闻的全球视角。
利用FinSen数据集,作者提出了一种创新的Focal Calibration Loss方法,将预测概率与实际结果紧密对齐,提高了金融预测的准确性和可靠性。作者的方法展示了将情感分析与精确校准技术相结合,为金融预测提供可信的方法。
简介
预测股市波动性是金融领域面临的重要挑战,市场的非线性和本质上的波动性使得准确预测市场趋势变得困难。传统模型主要依赖历史数字数据,难以捕捉市场波动的多方面动态。公共数据集中缺乏精确的时间信息,使得追求未知因素对金融市场波动的影响变得复杂。情绪因素在市场分析中的作用备受关注,但其对市场波动的可靠性仍需探究。
本文介绍了利用神经网络和情感分析预测金融市场波动的方法。作者提出了一个新的金融数据集FinSen,并建立了情感分数和S&P 500波动之间的因果关系。作者还提出了一种新的损失函数Focal Calibration Loss,用于提高模型的可靠性和预测准确性。最终,作者的模型在预测金融市场波动方面取得了令人印象深刻的结果和解释性。
相关工作
股市预测的相关情绪数据集
常见用于预测股票价格的情感数据集,包括Financial PhraseBank、Reuters-21578 News Dataset、StockTwits Dataset、TweetFinSent、PsychSignal Dataset和AG News。这些数据集中的情感数据可以捕捉市场情绪对股票波动的潜在影响。作者认为,金融指标和新闻也是预测股票价格的主要贡献因素。
股票市场相关预测方法
情感分析和机器学习技术的融合在股市预测领域中表现出了很大的潜力。虽然LSTM模型在预测准确性方面表现出了优越性,但它在提供可靠的置信度估计方面存在缺陷。之前的研究忽略了模型的可解释性和可信度,这可能会导致在实际市场中的投资失败率。已有的一些技术在金融预测方面表现出了有效性,但它们都忽略了模型的可解释性和可信度。
神经网络模型校准技术
模型校准的相关工作如Platt Scaling和Isotonic Regression,这些方法主要集中在调整已经训练好的模型的输出上。后来的一些方法,如Focal Loss,虽然更加灵活,但也存在过度自信或过度谨慎的问题。各种网络校准技术都可以通过复杂的指标来衡量校准质量,如预期校准误差和Brier得分。
数据和方法
本文目标变量是标准普尔500指数(S&P 500)的每日百分比变化,用于探索与情绪分数之间的因果关系。建立因果证据后,将此特征纳入LSTM模型进行预测和校准实验。
FinSen数据收集和预处理
标准普尔500指数OHLCV数据,包括开盘价、高点、低点、收盘价和成交量,用于提取价格动量和波动性。该数据来源于雅虎财经API,时间为2020年1月至2023年6月。我们研究的监督目标是标准普尔500指数动量、波动率和对数波动率。数据采集采用先进的网络抓取技术,从知名财经新闻网站、Trading Economics、经济指标来源和财经新闻中采集新闻标题和内容。贸易经济平台提供来自196个国家的2000多万个指标,包括汇率、股票、指数、债券和大宗商品价格的历史和当前数据。FinSen数据集包含超过16万条记录,收集时间跨度为15年,旨在确保全球经济状况与时间信息的广泛代表。
使用FinBERT对预处理后的财经新闻文章进行情感分析和注释,FinBERT是一种专门为财经文本设计的微调BERT模型。这一步将定性的新闻内容转化为定量的情绪得分,便于情绪数据的整合。我们从FinBERT获得的情绪得分。
-
新闻的情感评分:编码的文本被输入到FinBERT中,FinBERT输出表示情感分类的逻辑。这个分数用s1表示,它的可能性范围为-1(消极)、0(中性)和+1(积极),代表了第i条新闻的情绪。
-
每日情绪汇总:为了获得每日情绪得分,我们汇总了每天所有新闻的情绪得分。第d天的每日情绪得分SAgg d = n1 d PN i=1 d((- 1∗P负)+(0∗P新)+(1∗P pos))),计算为当天所有新闻情绪得分的平均值,其中N d是第d天新闻的总数。
方法
基于因果验证情感评分的LSTM波动率预测。为了探索市场情绪作为标准普尔500指数波动预测因素的潜力,我们进行了格兰杰因果检验,并将SAgg d视为x。这种统计方法确定了一个时间序列是否可以预测另一个时间序列,有效地检验了两个变量之间的因果关系。
我们评估了从金融新闻中得出的情绪得分(X)是否可以预测标准普尔500指数的波动性(y)。
鉴于市场情绪得分(X)与标准普尔500指数波动率(y)之间建立了格兰杰因果关系,我们将情绪分析整合到LSTM模型中来预测波动率。LSTM模型使用传统的输入特征和情绪得分。
将因果验证特征嵌入DAN 3进行文本分类。我们使用DAN 3,通过首先将标记索引转换为向量,然后对这些向量进行平均以形成每个文本实例的固定大小的向量表示来处理文本数据。然后,这个表示通过一系列密集的层进行处理,这些层与批处理规范化相互交错,最终形成一个映射到输出类数量的输出层。
焦点校准损失。焦点校准损失(Focal Calibration Loss)旨在解决文本分类器在训练过程中的两个主要挑战:类不平衡和模型校准。其设计背后的直觉植根于提高模型性能,同时确保预测概率与真实结果一致。焦点校准损失结合了Focal Loss和Calibration Error两个组成部分,并纳入了正则化参数λ,以平衡关注硬示例和确保模型预测的适当校准之间的权衡:
使用MAE进行校准误差的理论基础来自预期校准误差(ECE)的概念,这是一种通过将预测分组到箱中并将平均预测概率与每个箱中的实际结果频率进行比较来评估校准的流行度量。虽然ECE提供了校准的分类估计,但MAE提供了连续的实例级校准测量。
实验
建立因果关系:市场波动的情绪得分
我们的分析始于评估标准普尔500指数波动率和新闻情绪得分的百分比变化的平稳性。我们采用增广Dickey-Fuller (ADF)检验,证明它们是平稳的,适合格兰杰因果检验。为了确定因果关系,我们采用回归模型来预测标准普尔500指数的百分比变化,表示为∆SP500,基于金融新闻文章的情绪得分。该模型的结构包括滞后30天的情绪得分,表示为X t - i,其中i的范围从1到k, k是30天的最大滞后。
我们通过方程(6)对限制性模型(不包括情绪得分)和非限制性模型(包括情绪得分)的残差进行f检验。如果f值在选定的显著性水平上大于临界值(0.05),我们拒绝原假设,这表明情绪得分“格兰杰导致”标准普尔500指数的波动。每个检验的原假设是自变量的滞后值不属于回归。根据这些测试的结果,我们制定了四种可能性,表示情绪得分与∆SP500之间的潜在因果关系。
我们检验了∆SP500是否能预测情绪得分,以及情绪得分是否能预测∆SP500。对所有k值(1到30)分别进行回归,其中k表示回归中的最大滞后长度。f统计量在1%、5%和10%水平上分别在滞后的第1、3、7、14和30天显著。这表明情绪得分存在“格兰杰原因”∆SP500。然而,没有一个f统计量足以拒绝原假设,这表明∆SP500不“格兰杰原因”情绪得分。结果表明,情绪得分确实“格兰杰导致”波动。
基于因果验证情感评分的LSTM增强
首先使用FinBERT预训练模型对新闻文章进行句子级情感标注,然后将情感得分聚合为每日的整体情感得分。接着将市场波动率和整体情感得分输入到LSTM模型中进行训练和预测。实验结果表明,加入情感得分的模型预测效果更好,其中Lag 14表现最佳,R2值达到94.84%。这表明,基于金融新闻的情感得分可以帮助预测股市波动率。
校准:嵌入增强DAN 3模型
使用多个数据集训练了全局池化CNN网络和DAN 3模型,其中包括20 Newsgroups、Financial PhraseBank、AG News和FinSen。使用GloVe嵌入和交叉熵、AdaFocal、DualFocal和Focal Calibration Loss等损失函数进行训练。在FinSen数据集上使用DAN 3模型和Focal Calibration Loss获得了较好的可靠性图表和ECE值。FinSen数据集在ECE方面表现出色,分类错误率显著降低。
总结
通过证明情感分数与市场波动之间的因果关系,并将这些因果验证的特征集成到LSTM模型中,我们的模型实现了更细致和可靠的市场预测。我们的FinSen数据集在文本分类任务中表现相对更好的校准性。在我们的Focal Calibration Loss上,DAN 3模型的ECE显著提高到3.34%,这表明模型不仅实现了高精度,而且其概率预测也与实际结果非常一致,使其在决策过程中非常可靠。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。