本文是LLM系列文章,针对《Enhancing Financial Sentiment Analysis via Retrieval Augmented Large Language Models》的翻译。
摘要
金融情绪分析对估值和投资决策至关重要。然而,传统的NLP模型受到其参数大小和训练数据集范围的限制,这阻碍了其在该领域的泛化能力和有效性。最近,在大量语料库上预先训练的大型语言模型(LLM)由于其值得称赞的零样本能力,在各种NLP任务中表现出了优异的性能。然而,将LLM直接应用于金融情绪分析带来了挑战:LLM的预训练目标和预测情绪标签之间的差异可能会影响其预测性能。此外,金融新闻的简洁性,往往缺乏足够的上下文,会大大降低LLM情绪分析的可靠性。为了应对这些挑战,我们引入了一个用于金融情绪分析的改进LLM框架。该框架包括一个指令调优的LLM模块,它确保LLM作为情感标签的预测因子,以及一个检索增强模块,它从可靠的外部来源检索额外的上下文。以传统模型和LLM(如ChatGPT和LLaMA)