ChatGPT Canvas：交互式对话编辑器

XiaoLiuLB

于 2024-10-05 19:41:40 发布

阅读量386

点赞数 14

文章标签： chatgpt 编辑器 AIGC 人工智能自然语言处理

本文链接：https://blog.csdn.net/XiaoLiuLB/article/details/142717897

版权

自两年前 ChatGPT 发布以来，主流 AI 均以对话形式进行交互。传统的对话式界面可以直观看到反馈结果，但在需要深度编辑和协作的项目中就略显局限。为了解决此问题，几个月前 Claude 就发布过 Artifacts 功能，用来拓展原有对话。而现在 ChatGPT 也推出了 Canvas（Introducing canvas）来应对更加复杂的交互需求。

目前，OpenAI 已经向 ChatGPT Plus 和 Team 用户推送 Canvas，企业和教育用户将在下周获得访问权限。当 Canvas 测试版结束后，会向所有 ChatGPT 免费用户开放此功能。

什么是 Canvas？

Canvas 是基于 GPT-4o 特别训练的一个模型（专门为写作和编程任务设计的协作工具），能够在需要时自动触发 Canvas 界面，并根据用户的需求进行精准的内容编辑和修改。为了让 GPT-4o 更好地与用户协作，OpenAI 的研究团队通过一系列自动化评估和合成数据生成技术，优化了模型的核心行为。这些行为包括生成多样化的内容、进行定向编辑、重写文档以及提供行内反馈。

补充细节

OpenAI 通过 20 多次自动化评估来衡量模型的改进，使用了创新的合成数据生成技术（例如从 OpenAI o1-preview 中提取输出），以加速解决写作质量和用户交互问题，而不依赖人工数据。

在训练中遇到的关键挑战之一是如何定义 Canvas 的触发条件。OpenAI 教会模型在处理复杂任务时触发 Canvas，例如“撰写关于咖啡豆历史的博客文章”，并避免在简单问答中过度触发，例如“帮我做晚餐新菜谱”。模型优先提高“正确触发”的准确性，即便牺牲了“正确不触发”的表现，最终达到了 83% 的准确率，相比于基准零样本 GPT-4o 显著提升。

另一个挑战是，在 Canvas 触发后如何调控模型的编辑行为，尤其是在定向编辑和重写之间做出选择。OpenAI 训练模型在用户明确选择文本时执行定向编辑，其他情况下倾向于进行重写。随着模型的优化，这一行为会持续改进。

对于写作和编程任务，优先提高 Canvas 定向编辑的表现。带有 Canvas 的 GPT-4o 比基准提示 GPT-4o 的表现提高了 18%。

最后，生成高质量注释也面临着困难。不同于前两个功能，这无法通过自动化轻松评估，因此使用人工评估来衡量注释的质量和准确性。结果发现，Canvas 模型在准确性方面相比于基准零样本 GPT-4o 提高了 30%，质量提升了 16%，说明合成训练比单纯的零样本提示更能显著提升模型的表现。

Canvas模型比带有提示指令的zero-shot GPT-4o准确率高30%，质量高16%。

Canvas 核心功能

借助 Canvas，用户可以通过突出显示特定部分，让 ChatGPT 关注并提供行内反馈和建议，类似于专业的文稿编辑或代码审查员。同时，用户还能够直接在 Canvas 中编辑文本或代码，增强对项目的掌控力。Canvas 还配备了一个快捷操作菜单，用户可以通过菜单执行各种实用任务，如调整文稿长度、调试代码，甚至恢复之前的版本（实测只能恢复上一版，不能跳跃恢复），使工作流程更加高效灵活。