COLING 2024 | 量化交易相关论文(附论文链接)

ceee9ba7eef3ea92a51f3c36940af366.png

写在前面

COLING (International Conference On Computational Linguistics)是自然语言处理和计算语言学领域的顶级会议,每两年举办一次。今年的 COLING 2024 于5月20日到5月25日在意大利都灵召开。本文介绍了COLING 2024 中收录的几篇量化交易相关的论文。

90f3a510a0da4310c03e9e6d98cd5da1.png

论文标题:

Large Language Models as Financial Data Annotators: A Study on Effectiveness and Efficiency

作者单位:

JPMorgan AI Research

论文链接:

https://arxiv.org/pdf/2403.18152

研究内容:

在金融领域,收集带标签的数据集由于领域专家稀缺和雇用成本高昂而面临挑战。尽管大型语言模型(LLMs)在一般领域数据集的数据注释任务上表现出了卓越的性能,但在特定领域数据集上的有效性尚未充分探索。为了解决这一差距,作者研究了LLMs作为金融文档中关系提取的高效数据注释器的潜力。作者比较了三个LLMs(GPT-4、PaLM 2和MPT Instruct)与专家注释者和众包工作者产生的注释。作者展示了当前最先进的LLMs可以作为非专家众包工作者的有效替代方案。作者使用各种提示和参数设置分析模型,并发现为每个关系组定制提示非常重要,通过提供属于这些组的特定示例尤为重要。此外,作者引入了一个可靠性指数(LLM-RelIndex)来识别可能需要额外关注的输出。最后,作者进行了广泛的时间、成本和错误分析,并为自动注释在特定领域设置中的应用和使用提供了建议。

f221e5ef44362c27727126d8c92e8938.png

prompt示例

c15c570d328bcca94d2570845d1c6020.png

实验结果

论文标题:

Extracting Financial Events from Raw Texts via Matrix Chunking

作者单位:

上海交通大学

论文链接:

https://aclanthology.org/2024.lrec-main.617.pdf

研究内容:

事件提取(Event Extraction, EE)在中国金融领域广泛用于提供有价值的结构化信息。然而,中国金融EE在应用场景中存在两个主要挑战。首先,事件需要从原始文本中提取,这使其与先前的工作如自动内容提取(ACE)EE任务不同,在该任务中,EE被视为一个给定实体跨度的分类问题。其次,识别金融实体可能非常繁琐,因为它们可能涉及多个元素。在本文中,作者介绍了CFTE,一种新的针对中国金融文本到事件提取的任务,直接从原始文本中提取金融事件。作者进一步呈现了一种用于金融事件提取的手动注释的丰富语言特征数据集FINEED,以及一个高效的矩阵分块方法MACK,专为从原始文本中提取金融事件而设计。特别地,FINEED采用了一种新颖的二维注释方法,可以可视化文本组成部分之间的相互作用。MACK方法通过保留标签频率分布具有容错性,当识别金融实体时。作者进行了广泛的实验,结果验证了MACK方法的有效性。

7389f6746c18ad08f6d64228cc05468f.png

aca6bf2eabc4940da47afd0e2cac7ee3.png

事件提取的示例

论文标题:

Saliency-Aware Interpolative Augmentation for Multimodal Financial Prediction

作者单位:

德里英德拉普拉斯塔信息技术研究所

论文链接:

https://aclanthology.org/2024.lrec-main.1244.pdf

研究内容:

对金融工具价格变动进行预测以用于风险建模和股票交易是具有挑战性的,因为股市的随机性。尽管金融AI领域的最新进展扩大了它们使用的数据和方法范围,例如来自财务业绩电话会议的文本和音频线索,但存在局限性。大多数数据集较小,并显示出由于数据来源性质而导致的领域分布偏移,这表明需要探索数据增强的强大策略,如Mixup。为了应对金融领域中的这些挑战,作者提出了SH-Mix:一种由显著性引导的层次化Mixup增强技术,用于多模态金融预测任务。SH-Mix结合了基于各个模态和上下文子序列贡献的多层嵌入混合策略。通过在包含文本和语音的财务收益和电话会议数据集上进行广泛的定量和定性实验,作者展示了SH-Mix在性能上超越了现有最先进的方法3%-7%。此外,作者还表明SH-Mix能够在不同的模态和模型中具有普适性。

764341d14ea7de911866c5b9d1a65622.png

模型框架

da66a4d8bd51bf948f0079c3787cef1d.png

实验结果

论文标题:

Prompting for Numerical Sequences: A Case Study on Market Comment Generation

作者单位:

AIST人工智能研究中心

论文链接:

https://arxiv.org/pdf/2404.02466

研究内容:

大语言模型(LLMs)已被应用于多种数据到文本的生成任务,包括表格、图形和时间序列数字数据到文本的设置。尽管对结构化数据如表格和图形生成提示的研究正在增加,但对时间序列数字数据的深入调查仍然缺乏。因此,本研究探索了各种输入表示,包括token序列和结构化格式如HTML、LaTeX和Python风格的代码。在本研究的实验中,作者专注于市场评论生成任务,该任务涉及使用股价的数字序列作为输入并生成相应的市场评论。与作者的预期相反,结果表明类似编程语言的提示产生了更好的结果,而那些类似于自然语言和较长格式的,如HTML和LaTeX,则效果较差。作者的发现为创建有效的用于从数字序列生成文本的任务的提示提供了洞见。

0f76a8f64632ae954c9b22c3104b9cde.png

评论生成示例

论文标题:

AlphaFin: Benchmarking Financial Analysis with RetrievalAugmented Stock-Chain Framework

作者单位:

华南理工大学

论文链接:

https://arxiv.org/pdf/2403.12582

研究内容:

金融分析的任务主要涵盖两个关键领域:股票趋势预测和相应的金融问题解答。目前,机器学习和深度学习算法已广泛应用于股票趋势预测,取得了显著进展。然而,这些方法无法提供预测的原因,缺乏可解释性和推理过程。此外,它们也无法整合诸如金融新闻或报告之类的文本信息。与此同时,大语言模型(LLMs)具有出色的文本理解和生成能力。但由于金融训练数据集稀缺且与实时信息的整合有限,LLMs仍然会产生幻觉并且无法跟上最新信息。为应对这些挑战,文中首次发布AlphaFin数据集,结合传统研究数据集、实时金融数据和手写的思维链数据(CoT),这对训练LLMs完成金融分析具有积极影响。然后使用AlphaFin数据集来对一个称为股票链的最新方法进行基准测试,该方法有效整合了检索增强生成(RAG)技术。作者进行了广泛的实验来展示框架在金融分析上的有效性。

c9791d0136ad31041493f0ee49977c0f.png

模型框架

cba4f7221b44bb7b66efff42cd9ed459.png

实验结果

往期推荐阅读

WWW 2024 | 量化交易相关论文(附论文链接)

AAAI 2024 | 量化交易相关论文(附论文链接)

IJCAI 2023 | 量化交易相关论文(附论文链接)

WWW 2023 | 量化交易相关论文(附论文链接)

KDD 2023 | 量化交易相关论文(附论文链接)

AAAI 2022 | 量化交易相关论文(附论文链接)

IJCAI 2022 | 量化交易相关论文(附论文链接)

WWW 2022 | 量化交易相关论文(附论文链接)

KDD 2022 | 量化交易相关论文(附论文链接)

解读:ChatGPT在股票市场预测方面的应用

解读:通过挖掘概念间共享信息,实现股票趋势预测的图模型框架

解读:机器学习预测收益模型应该采取哪种度量指标

解读:基于订单流、技术分析与神经网络的期货短期走势预测模型

【python量化】多种Transformer模型用于股价预测(Autoformer, FEDformer和PatchTST等)

【python量化】挖掘股价中的图关系:基于图注意力网络的股价预测模型

【python量化】基于backtrader的深度学习模型量化回测框架

【python量化】将Transformer模型用于股票价格预测

【python量化】搭建一个CNN-LSTM模型用于股票价格预测

【python量化】利用首个时序大模型TimeGPT进行股价预测

《人工智能量化实验室》知识星球

加入人工智能量化实验室知识星球,您可以获得:(1)定期推送最新人工智能量化应用相关的研究成果,包括高水平期刊论文以及券商优质金融工程研究报告,便于您随时随地了解最新前沿知识;(2)公众号历史文章Python项目完整源码;(3)优质Python、机器学习、量化交易相关电子书PDF;(4)优质量化交易资料、项目代码分享;(5)跟星友一起交流,结交志同道合朋友。(6)向博主发起提问,答疑解惑。

beedff6e4edfcbf124de004c3f28a9e1.png

  • 24
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值