Llama 2是对Llama进行了更新的版本,可以理解为预训练版本。Llama 2-chat是针对对话场景优化过的Llama 2微调版本,理解为监督学习+强化学习后的微调版本。 下面按照大模型的预训练和微调,两大核心章节展开,总体模型训练框架图如下: