CoT-Decoding

公众号/视频号/小红书/微博     :人工智能技术派
人工智能技术派(AITECH)成员:hws

  • ⎣优化技术⎤
  • 一种解码策略优化技术:目标是不需要任何显示的CoT prompting,能够有效提升大型语言模型在各种推理任务中的表现,并通过自发地揭示CoT推理路径,改善模型的推理能力和准确性。

背景介绍

大模型推理,prompt会在很大程度上影响结果准确性,因此很多公司专门设置"prompt工程师"这个职位,显然就像先前NLU写规则一样,获取适合任务的prompt也渐渐成为一个非常耗费人力的方向,那么是否可以在保证精度的情况下,跳过编写prompt这个流程?

方案阐述

既然通过合适的prompt可以获理正确的结果,那么理论上即使不需要任何explicit的CoT prompting,包含CoT过程的解码路径(decoding path)也是自然存在于LLM之中的,作者实验发现,只要多输出接个结果就模型就会给出正确的结果。

归纳总结

从实现方案及效果来看,该技术方案离“不需要任何显式的CoT prompting”还有一定距离。

  1. 计算量增加:从Figure-3可以看出,通常topk越大效果越好,但与之相应的是计算量也会增加

2. 效果比few shot 要差:从Figure4可以看出:效果比Few-shot CoT差,在token数小于40时,甚至小于zero-shot

3. 应用领域受限:确定答案区间比较重要,针对不同的任务答案区间的确定方法不统一

参考文献

如遇排版问题,请参阅创作链接

  • 27
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值