闲聊大模型推理能力

推理的定义:根据已知信息进行逻辑推断,从而得出新的结论或理解

LLM的推理能力来源:

(1)LLM训练用的海量文本数据集中包含了 大量表达因果关系的结构、语法结构和句式,比如“因为”、“所以”。在训练过程时,模型通过分析这些结构,学习了如何将因果关系映射到内部的表示系统里。

(2)在prompt当中提供了与训练数据相似的上下文语境,使得LLM存在迁移的可能。

(3)垂类数据训练后的泛化:这些模型通过在海量数据上的训练,学会了识别语言中的模式和关联。当面对一个问题时,它们能够利用这些模式和关联,从其训练数据中“回忆”起相关的信息,并应用这些信息来生成回答。

总结起来 LLM具备推理能力 是 数据驱动和模型内部表示的自然结果

激发推理能力的方法:

(1)垂类训练数据集的多样性增强

(2)RAG(引入外部数据库作为上下文)

(3)对模型进行RLHF训练:不断强化LLM的推理策略

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值