Causal Prompting: Debiasing Large Language Model Prompting based on Front-Door Adjustment

UnknownBody

于 2024-05-21 11:38:06 发布

阅读量280

点赞数

分类专栏： LLM Daily LLM Prompt 文章标签：语言模型人工智能自然语言处理

本文链接：https://blog.csdn.net/c_cpp_csharp/article/details/139088098

版权

LLM Daily 同时被 2 个专栏收录

1271 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

LLM Prompt

40 篇文章

订阅专栏

本文提出了一种新的因果提示方法，利用结构因果模型和前门调整来减轻大规模语言模型（LLM）的偏见。通过对LLM生成的思想链进行中介变量分析，实现了无需访问模型参数的因果干预。对比学习用于优化编码器，以提高因果效应估计的准确性。实验证明该方法在多个NLP任务上表现出色。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文是LLM系列文章，针对《Causal Prompting: Debiasing Large Language Model Prompting based on Front-Door Adjustment》的翻译。

摘要

尽管现有的提示方法（如上下文学习和大型语言模型的思维链）取得了重大成就，但它们仍然面临着各种偏见的挑战。传统的去偏方法主要集中在模型训练阶段，包括基于数据增强和基于重加权的方法，其局限性在于解决LLM的复杂偏差。为了解决这些局限性，使用结构因果模型揭示了提示方法背后的因果关系，并提出了一种基于前门调整的新型因果提示方法，以有效减轻LLM的偏差。具体而言，因果干预是通过设计提示来实现的，而无需访问LLM的参数和logits。LLM产生的思想链被用作中介变量，输入提示和输出答案之间的因果效应通过前门调整来计算，以减轻模型偏差。此外，为了准确地获得样本的表示并更准确地估计因果效应，对比学习用于通过将编码器的空间与LLM对准来微调样本的编码器。实验结果表明，该因果提示方法在开源和闭源LLM的3个自然语言处理数据集上都取得了良好的性能。