OmniGen 是智源推出的一款全新的扩散模型架构,专注于统一图像生成。它简化了图像生成的复杂流程,通过一个框架处理多种任务,例如文本生成图像、图像编辑和基于视觉条件的生成等。此外,OmniGen 通过统一学习结构实现了知识迁移,使其能够适应不同的任务和领域需求。该模型不仅高度简化和易用,还在图像生成领域展示了强大的灵活性。
功能介绍:
-
文本生成图像:通过文本描述生成相应的图像。
-
图像编辑:根据用户需求对图像进行局部或整体编辑。
-
角色一致性生成:在多个图像中保持角色的外观一致。
-
基于视觉条件的生成:根据视觉条件(如姿态或边缘信息)生成符合特定要求的图像。
【OmniGen】模型已经在趋动云『社区项目』上线,无需自己创建环境、下载模型,一键即可快速部署,快来体验【OmniGen】带来的精彩体验吧!
-
项目入口:https://open.virtaicloud.com/web/project/detail/553138076546117632
视频教程:
云平台一键部署【OmniGen】多功能图像生成模型_哔哩哔哩_bilibili
启动开发环境
进入【OmniGen】
项目主页中,点击运行一下
,将项目一键克隆至工作空间,『社区项目』推荐适用的算力规格,可以直接立即运行
,省去个人下载数据、模型和计算算力的大量准备时间。
配置完成,点击进入开发环境
,根据主页项目介绍进行部署。
使用方法:打开gemini/code/使用说明.ipynb中的二、WebUI操作界面 ,选中单元格,点击运行。
等待生成local URL,右侧添加端口7680。
示例展示:
示例1:
示例2:
示例3:
➫温馨提示: 完成项目后,记得及时关闭开发环境,以免继续产生费用!