Step1X-Edit开源了，仅需45GB就可以获得GPT4o的编辑效果

最新推荐文章于 2025-05-20 21:08:02 发布

吴脑的键客

最新推荐文章于 2025-05-20 21:08:02 发布

阅读量615

点赞数 12

分类专栏： AI作画文章标签：人工智能开源 AIGC AI作画

本文链接：https://blog.csdn.net/weixin_41446370/article/details/147529950

版权

AI作画专栏收录该内容

113 篇文章

订阅专栏

在这里插入图片描述

我们发布了最先进的图像编辑模型 Step1X-Edit，其性能可与 GPT-4o 和 Gemini2 Flash 等闭源模型相媲美。更具体地说，我们采用了多模态 LLM 来处理参考图像和用户的编辑指令。我们提取了潜在嵌入，并将其与扩散图像解码器相结合，从而获得目标图像。为了训练模型，我们建立了一个数据生成管道，以生成高质量的数据集。为了进行评估，我们开发了 GEdit-Bench，这是一种植根于真实世界用户指令的新型基准。在 GEdit-Bench 上的实验结果表明，Step1X-Edit 的性能大大优于现有的开源基线，并接近领先的专有模型，从而为图像编辑领域做出了重大贡献。

在这里插入图片描述