基于大语言模型（LLM）的表格理解任务探索与实践

lichunericli

已于 2024-03-14 15:49:36 修改

阅读量3.6k

点赞数 39

文章标签：人工智能自然语言处理语言模型

于 2024-03-14 15:45:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lichunericli/article/details/136711309

版权

本文探讨了大语言模型（LLMs）在表格理解任务中的应用，包括文本推理、符号推理和融合方法。研究显示，GPT4Table和Rethinking Tabular Data Understanding with LLMs等方法在表格数据理解上取得了进展。符号推理通过单轮和多轮推理策略，如ReAct、PandasAI和TaskWeaver，提高了处理复杂表格问题的能力。融合方法通过投票和大模型整合提升了解答的准确性。未来的研究挑战包括解决复杂问题、多表联合分析以及效率和成本的平衡。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

大语言模型（LLMs）的发展日新月异，为表格理解任务带来了新的可能性。表格理解任务，如基于表格的问答和表格事实验证，要求从自由形式的文本和半结构化的表格数据中提取深层次的语义信息。与泛化的文本推理任务不同，表格数据的复杂性对推理任务提出了更高的要求。

目前，研究者们主要探索了两种技术路线来应用LLMs于表格理解任务。

针对表格数据类型对LLMs进行领域适配，以更好地支持表格数据的理解。
直接使用预训练的通用LLMs，并借助一些额外手段（如Prompt技巧、工具使用等）来完成表格理解任务。

1、方法概览

直接使用预训练LLMs进行表格数据理解的技术路线主要有两种主流做法。第一种是基于文本推理的直接方式，将全量表格数据以一定分隔符的方式标记，作为Prompt的一部分输入LLMs，并结合Prompt技巧，直接对问题进行文本推理。第二种是基于符号推理的间接方式，将表格的结构信息（如表头、数据样例等）输入Prompt，根据任务需求指导LLMs编写一定的代码（如SQL、Python等），并调用对应的工具执行代码，得到想要的结果。

1.1、文本推理的方式

1.1.1、GPT4Table

GPT4Table提出了一种全新的benchmark，并在此基础上验证了ChatGPT在各个子任务上的效果。研究团队提出了self-augmentation的Prompt技巧，进一步提升了理解效果：

首先让LLM输出一些对表格数据的理解作为额外的知识
将这些额外的知识加入到之前的问题prompt里，用于生成最终的答案

他们将表格数据的结构理解能力分为两大类：

区分出表格数据（从文本中定位出哪些内容表示的是表格数据）及解析表格数据（从各种类型，包括XML、CSV、XLSX等，中解析出表格数据的能力）
搜索（根据值进行位置搜索/根据位置定位到单元格值）和检索（根据行列信息找到对应的值）

他们设计并对比了一系列Prompt方式进行文本推理进行表格数据理解任务的能力，得出了一些结论和技巧。

不同分隔符的差异：在prompt中使用HTML语言表示数据，能普遍取得比简单分隔符表示数据更好的效果。
one-shot相比zero-shot效果提升明显：尤其是对于一些高度依赖结构解析能力的任务。
Prompt顺序的影响：添加的外部信息的prompt放在表格数据之前比放在之后会更好。
有关Partition mark和format explanation的prompt可能损失搜索/检索相关的能力

最低0.47元/天解锁文章

博客等级

码龄9年

415
原创

1万+
点赞

9866
收藏

6931
粉丝

关注

私信

热门文章

分类专栏

传统文化 2篇
人工智能 9篇
传统文化-易经 17篇
数据库 10篇
经济学 2篇
沟通 1篇
Java 2篇
缓存 4篇
架构 1篇
搜索引擎 4篇
消息队列 2篇
微服务 1篇
注意事项 1篇
LLM 应用实现总结 8篇
GIT 1篇
IM即时通讯 1篇

展开全部收起

上一篇：: NLP 算法实战项目：使用 BERT 进行文本多分类

下一篇：: PEFT中的主流微调方法(LORA、QLoRA、Adapter Tuning、Prefix Tuning、Prompt Tuning、P-Tuning及P-Tuning v2)

最新评论

Mamba和状态空间模型(SSM)的视觉指南：替代 Transformers 的语言建模方法
a.南曦: 能请问一下，可不可以共享一下第一张图片的高清图片呀
记一次港交所面试
liulicsu: 是纯英文面试吗
拆解 Transformer 的训练过程
tjuwzan: 最近在看Transformer的知识，的确有些地方有点没搞明白，想先请教几个问题： 1. 本篇主要讲Transformer的训练环境，图上模型最右侧，也就是Decoder的下面，是Output Embedding, 最上面是Output，他们之间有关系吗？ 2. 训练，如果是传统的机器学习或者深度学习，如果是Supervised Learning的话，应该有输入，ground truth，以及loss function，但Transformer很少有人提这个，那么Transformer的学习过程是什么？Loss Function是什么？ 3. 还是训练问题，普通深度学习模型学习的大概是W and B，Transformer的学习是Wq, Wk, Wv吗？是如何学习的呢？尤其在第7节里描述：例如，对于计算 Query 矩阵，权重矩阵的行数必须与转置矩阵的列数相同，而权重矩阵的列数可以任意；例如，我们假设权重矩阵有 4 列。权重矩阵中的值介于 0 和 1 之间，随机初始化，当 Transformer 开始学习语料的含义时，这些值会更新。文中提到的三句话，是不是语料？咱们的例子中是不是就是用这三句话作为训练例子呢？ 4. 依然是文章中描述的，把when you play the game of thrones, you win or you die. 这句话有两个部分，前面部分作为输入，后面部分作为输出，那么第一句，I drink and I know things，这里面只有一句，怎么分输入和输出呢？ 5. 掩码的作用没太理解，可否解释一下呢？很多都说是为了让模型只参考前面，而不看后面，这句话还是没有真正理解。程序员出身，一直是按照程序员思维想弄清楚每个细节，但是NLP基础有点薄弱，理解一些思想有点难度。多谢解答
Java内存模型（JMM）与Volatile关键字底层原理
Yunwushenyanying: 讲的太全面了！非常有帮助
记录些MySQL题集（4）
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619168846。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。