作者:老余捞鱼
原创不易,转载请标明出处及原作者。
写在前面的话:
这篇论文介绍了一个名为FinSen的新型金融数据集,它通过结合197个国家的经济金融新闻文章和股市数据,提供了一个时间跨度为15年的全面数据视角。利用这个数据集,研究者们采用因果验证的情感分析和长短期记忆(LSTM)模型来增强市场预测的准确性和可靠性。他们提出了一种新的损失函数——Focal Calibration Loss,显著降低了预期校准误差(ECE),使得预测结果与实际市场表现更加吻合,这对于金融领域中对预测准确性要求极高的投资决策具有重要意义。
1. 引言
预测股市波动性对于投资策略、经济预测和风险管理实践的基础性作用。作者分析了市场的非线性和固有波动性,以及由于市场对最新事件和情绪的敏感性导致的预测准确性的挑战。此外,提到了传统模型主要依赖历史数据,在捕捉市场波动的多维动态方面的不足。最后,提出了一个关键的研究问题:新闻事件中的情感是否能够作为市场波动的可靠预测因素,并指出了公共数据集在提供精确时间信息方面的缺失,这增加了寻找对市场波动有重大影响的未知因素的复杂性。
2. 相关工作
2.1 与股票市场预测相关的情绪数据集
- Financial PhraseBank:包含金融新闻中的句子,分为正面、负面和中性情绪,专为金融语境设计。
- Reuters-21578 News Dataset:作为文本分类任务的基础基准,包含1987年路透社新闻专线的文档。
- StockTwits Dataset:包括来自StockTwits平台的消息