大模型——Step1X-Edit:自然语言指令编辑图像的开源工具
综合介绍
Step1X-Edit 是一个开源图像编辑框架,由 Stepfun AI 团队开发,托管于 GitHub。它结合多模态大语言模型(Qwen-VL)和扩散变换器(DiT),让用户通过简单的自然语言指令编辑图像,例如更改背景、移除物体或转换风格。项目于 2025 年 4 月 25 日发布,性能接近闭源模型如 GPT-4o 和 Gemini 2 Flash。Step1X-Edit 提供模型权重、推理代码和 GEdit-Bench 基准测试,支持广泛的编辑场景。Apache 2.0 许可证允许免费使用和商业开发,吸引了开发者、设计师和研究人员。社区支持活跃,已推出 ComfyUI 插件和 FP8 量化版本,优化硬件需求。
目前可在 阶跃AI 免费体验。但实际图像编辑效果与 GPT-4o 、 Gemini 2 Flash 差距略大。