ChatGPT最新模型canvas是什么?

一、什么是canvas?

简单来说,是ChatGPT里一个内置的新交互体验,可以弹出页面以更好地辅助用户进行写作(writing)和编码(coding)。

你可以通过在提示中输入“使用画布(use canvas)”来手动打开,ChatGPT也会在检测到可能有用的场景时,自动打开Canvas。

进入到Canvas的界面,它会在右下角有几个用于写作和编码的快捷键。

对于写作项目,用户可以要求 ChatGPT 提供编辑建议或长度调整,或者要求它将一段文本的阅读级别从研究生水平降低到幼儿园水平。它还可以添加“相关的表情符号以强调和着色”。

程序员可以让 ChatGPT 审查他们的代码并添加内联改进建议。它还可以用日志和注释标记您的工作,以帮助调试并使您更容易理解代码。它还能够在 Canvas 模式下修复错误并将编码移植到不同的语言,例如 JavaScript、TypeScript、Python、Java、C++ 或 PHP。

二、在canvas中编码

编码是一个迭代过程,在聊天中跟踪对代码的所有修订可能很困难。Canvas 可以更轻松地跟踪和理解 ChatGPT 的更改,我们计划继续提高此类编辑的透明度。

编码快捷方式包括:

  • 审查代码: ChatGPT 提供内联建议来改进您的代码。

  • 添加日志:插入 print 语句以帮助您调试和理解代码。

  • 添加注释:向代码添加注释以使其更易于理解。

  • 修复错误:检测并重写有问题的代码以解决错误。

  • 移植到某种语言:将您的代码转换为 JavaScript、TypeScript、Python、Java、C++ 或 PHP。

三、训练模型成为协作者

OpenAI训练 GPT-4o 作为创意合作伙伴进行协作。该模型知道何时打开画布、进行有针对性的编辑和完全重写。它还了解更广泛的上下文,以提供准确的反馈和建议。

为了支持这一点,我们的研究团队开发了以下核心行为:

  • 触发画布进行编写和编码

  • 生成多样化的内容类型

  • 进行有针对性的编辑

  • 重写文档

  • 提供内联评论

OpenAI通过 20 多项自动化内部评估来衡量进展情况。我们使用了新颖的合成数据生成技术,例如 OpenAI o1-preview 中提取输出,以针对其核心行为对模型进行后训练。这种方法使我们能够快速解决写作质量和新用户交互问题,而无需依赖人工生成的数据。

一个关键挑战是定义何时触发画布。我们教模型打开画布以提示 “Write a blog post about the history of coffee beans” ,同时避免过度触发一般的问答任务 “Help me cook a new recipe for dinner” 等。对于编写任务,我们优先改进“正确的触发器”(以牺牲“正确的非触发器”为代价),与带有提示说明的基线零镜头 GPT-4o 相比,达到了 83%。

值得注意的是,此类基线的质量对所使用的特定提示高度敏感。使用不同的提示,基线可能仍然表现不佳,但方式不同,例如,编码和编写任务之间均匀不准确,从而导致错误分布不同和性能欠佳的替代形式。对于编码,我们故意使模型不触发,以避免干扰我们的高级用户。我们将继续根据用户反馈进行改进。

第二个挑战涉及在触发画布后调整模型的编辑行为,特别是决定何时进行有针对性的编辑,而不是重写整个内容。我们训练模型在用户通过界面显式选择文本时执行有针对性的编辑,否则会倾向于重写。随着我们优化模型,此行为会不断演变。

最后,训练模型生成高质量的评论需要仔细迭代。与前两种情况不同,前两种情况很容易适应通过彻底的人工审核进行自动评估,而以自动化方式衡量质量则特别具有挑战性。因此,我们使用人工评估来评估评论的质量和准确性。我们的集成画布模型在提示指令的准确率和 16% 的质量上比零射击 GPT-4o 高出 30%,这表明与带有详细说明的零射击提示相比,合成训练显着提高了响应质量和行为。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值