作者:老余捞鱼
原创不易,转载请标明出处及原作者。
写在前面的话:
本文探讨了微调大型语言模型(LLMs)以利用财务新闻流预测股票回报的方法,比较了编码器和解码器LLMs在不同文本表示方法下的性能,并发现聚合表示通常能提升投资组合表现,其中Mistral模型在多个投资宇宙中表现稳健,而基于LLMs的回报预测比传统情感分析更能增强投资组合构建的效果。
1. 引言 (Introduction)
本文阐述量化投资领域中利用财务文本数据进行投资组合构建的重要性,并强调了自然语言处理(NLP)技术,尤其是大型语言模型(LLMs)在文本分析中的先进能力。随着NLP技术的发展,财务文本数据的应用在量化投资中变得日益重要。作者指出,尽管LLMs在多种语言任务上展现出卓越的性能,但直接利用这些模型进行股票回报预测的研究还相对缺乏。因此,本文旨在探索微调LLMs以预测股票回报,提出了一种新颖的方法,即直接从财务新闻到股票回报的预测,这种方法可能比传统的特征提取和验证流程更为高效。此外,本文还将比较不同LLMs在文本表示上的差异,以及它们对投资组合性能的影响,旨在为投资者提供更深入的洞见和更有效的工具。
2. 相关工作 (Related Work)
本文探讨了利用财务文本数据进行股票市场预测的相关研究工作。首先回顾了早期研究中采用的基于词嵌入的技术,这些技术虽然能够提取文本数据中的信息,但缺乏对语境的深入理解。例如,一些研究通过分析金融新闻流中的情感分数、社交媒体帖子来预测股票价格,但这些方法未能充分利用文本的上下文信息。
接着介绍了大型语言模型(