OpenAI 发布了新的 AI 模型 - CriticGPT,旨在识别由 ChatGPT 生成的代码中的错误。通过 Reinforcement Learning from Human Feedback (RLHF:来自人类反馈的强化学习),CriticGPT 可以帮助人类审查员提高大语言模型 (LLM) 的输出准确性。
由于模型变得更有知识,错误变得更加微妙,人类培训师难以准确评估。而 CriticGPT 是基于 GPT-4 的模型,用于撰写 ChatGPT 响应的批评,用以帮助人类培训师在 RLHF 过程中发现错误。
本文介绍了 CriticGPT 的训练方式,以及它的优势和劣势。
点击原文查看详情:OpenAI 新模型给自己挑刺!GPT-4 的代码审查员