大型语言模型综述(二)
文章目录5 . LLMS自适应调优5.1指令调优5.1.1、格式化实例构造5.1.2指令调优策略5.1.3、指令调优的效果5.2、对齐调整5.2.1、比对的背景和标准5.2.2、收集用户反馈5.2.3、基于人工反馈的强化学习5.3、高效调优5.3.1、参数高效的微调方法5.3.2 LLMs上的参数高效微调6、利用6.1、情境学习6.1.1、提示制定6.1.2、论证设计6.1.3、底层机制6.2、思维链提示6.2.1、基于CoT的情境学习6.2.2、CoT的进一步讨论7、能力评价7.1、基本评估任务7.1.1
复制链接