添加图片注释,不超过 140 字(可选)
更多AI前沿科技资讯,请关注我们:
closerAI-一个深入探索前沿人工智能与AIGC领域的资讯平台
【closerAI ComfyUI】开源核爆!Step1X-Edit正掀起AIGC工具平民化革命,开启全民AI图像编辑新时代!!用嘴P图,小白也能秒变大神!
大家好,我是Jimmy。在图像编辑领域,研究人员和开发者一直在寻求能够提供更高效、更精准的解决方案。最近,一个名为Step1X-Edit的开源项目引起了广泛关注。该项目旨在通过一种统一的图像编辑模型,实现对各种真实用户指令的出色表现。该框架的目标是超越现有的开源基准,并接近封闭源代码模型的性能,如GPT-4o和Gemini2 Flash。通过采用多模态大型语言模型(LLM),Step1X-Edit能够处理参考图像和用户的编辑指令,并生成目标图像。
Step1X-Edit是阶跃星辰于2025年4月推出的开源图像编辑大模型,总参数量19B(7B多模态语言模型MLLM+12B扩散模型DiT),旨在提供精准、可控、高保真的通用图像编辑能力。
添加图片注释,不超过 140 字(可选)
其核心能力包括:
-
语义精准解析:支持自然语言描述的复杂组合指令(如“将图片改为清晨,人物服装换成古装”),无需预设模板,可识别并替换图像中的文字。
-
身份一致性保持:编辑后稳定保留人脸、姿态等特征,适用于虚拟人、电商模特等高一致性场景。
-
区域级精细控制:对指定区域进行文字、材质、色彩等定向编辑,保持整体风格统一。
技术架构创新
模型采用MLLM+DiT解耦式架构,突破