前言
TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and Textual Content in Finance是2021年5月发表在ACL上的文章。改文章主要介绍针对基于金融领域表格(Tabular)和文本(Textual)混合(Hybrid)(即结构化和非结构化混合数据)的数据进行问题回复的研究。
文章获取链接: 论文下载链接.
一、摘要(abstract)
在论文摘要中,作者介绍了现有的研究,忽视了混合数据的问题回答(QA)。
本文的创新工作,1、从实际财务报告中抽取样本,构建一个包含表格和文本的大型QA数据集,命名为 TAT-QA。2、为了对表格数值进行推理,本文提出了一个新的模型TAGOP。
数据集获取链接: TAT-QA下载链接.
二、引言(Introduction)
1.引入库
代码如下(示例):
import nu