
1.17组会汇报
在通过对20个样本的审查确保描述包含足够的表格生成信息后,我们发现GPT-3.5和GPT-4的性能有很大的局限性,尤其是在处理复杂结构时。如图3,提出了FORMATCOT,使用GPT-3.5生成格式指令,这是一种自指导方法,用于生成{数据、指令}对,以达到微调的目的。首先,我们执行基于模型的评估,用两个表查询GPT-3.5,让它分别对内容和格式的相似性进行评分。:包括GPT-NeoX-20B、GPT-3.5、GPT-4、Vicuna-13B、LLaMA-7B,以及经过微调的LLaMA-7B模型。




















