推理的定义:根据已知信息进行逻辑推断,从而得出新的结论或理解。
LLM的推理能力来源:
(1)LLM训练用的海量文本数据集中包含了 大量表达因果关系的结构、语法结构和句式,比如“因为”、“所以”。在训练过程时,模型通过分析这些结构,学习了如何将因果关系映射到内部的表示系统里。
(2)在prompt当中提供了与训练数据相似的上下文语境,使得LLM存在迁移的可能。
(3)垂类数据训练后的泛化:这些模型通过在海量数据上的训练,学会了识别语言中的模式和关联。当面对一个问题时,它们能够利用这些模式和关联,从其训练数据中“回忆”起相关的信息,并应用这些信息来生成回答。
总结起来 LLM具备推理能力 是 数据驱动和模型内部表示的自然结果。
激发推理能力的方法:
(1)垂类训练数据集的多样性增强
(2)RAG(引入外部数据库作为上下文)
(3)对模型进行RLHF训练:不断强化LLM的推理策略