《论文阅读》ChatGPT相关技术之思维链(CoT in LLMs)
2023-3-17组会记录
ChatGPT相关技术之思维链(CoT in LLMs)
前言
本周分享的三篇论文为:
《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》
- 提出思维链方法
《Large Language Models are Zero-Shot Reasoners》
- 思维链融合零样本
《Self-consistency improves chain of thought reasoning in language models》
- 改变解码策略
语言模型到思维链的提出
近些年来,语言模型规模不断变大,其内部暗藏的神秘力量逐渐被人们发掘出来,并且模型的能力随着参数量的级别(M->B)上升拥有了一定的泛化能力。举个例子来说,当直接给模型输入