HiDiffusion 是旷视科技推出的开发的一种创新框架,旨在提升预训练扩散模型在生成高分辨率图像方面的创造力和效率。这是一种无需训练即可提高预训练扩散模型的分辨率和速度的方法,通过将 HiDiffusion 应用于各种预训练的扩散模型,不仅可以将图像生成的分辨率提高至 4096×4096,而且能将图像生成速度提升 1.5 至 6 倍。这一方法不仅解决了对象重复和高计算负担的问题,而且在生成高分辨率图像的任务上取得了卓越的效果。 

使用云平台:OpenBayes

openbayes.com/console/signup?r=sony_0m6v

登录到 OpenBayes 平台后,打开「公共教程」,找到「HiDiffusion 可快速生成高质量 8k 图像 Demo」的教程。

高分辨率框架 HiDiffusion 运行教程,快速生成高质量 8k 图像_语言模型

进入教程后,点击右上角「克隆」。

高分辨率框架 HiDiffusion 运行教程,快速生成高质量 8k 图像_人工智能_02

平台在克隆过程中会自动为容器绑定所需要的数据,不需要我们再手动配置,直接点击「下一步:选择算力」。

高分辨率框架 HiDiffusion 运行教程,快速生成高质量 8k 图像_机器学习_03

推荐选择 RTX 4090,别忘了使用文章开头的邀请链接,get 免费时长!选择好后,点击「下一步:审核」即可。

高分辨率框架 HiDiffusion 运行教程,快速生成高质量 8k 图像_图像处理_04

确认无误后,点击「继续执行」。

高分辨率框架 HiDiffusion 运行教程,快速生成高质量 8k 图像_深度学习_05

稍等 2 分钟,系统分配资源完成后,待状态显示为运行中后,将鼠标悬停在 API 地址处,点击链接进入模型。使用 API 需要进行现进行实名认证~

高分辨率框架 HiDiffusion 运行教程,快速生成高质量 8k 图像_语言模型_06

高分辨率框架 HiDiffusion 运行教程,快速生成高质量 8k 图像_人工智能_07

HiDiffusion 适用于三种方式分别为文本生成图像、图像生成图像、修复图像,它们都对应一个模型。在使用时会首先加载模型而后进行图像的生成。

方式一:文本生成图像

通过输入正向提示词与方向提示词进行图像生成。

正向提示词描述希望在图像中看到的内容;反向提示词描述不希望在图像中出现的内容。

我们选择一个示例:

高分辨率框架 HiDiffusion 运行教程,快速生成高质量 8k 图像_人工智能_08

其中正向提示词为:Standing tall amidst the ruins,a stone golem awakens,vines and flowers sprouting from the crevices in its body

反向提示词有:blurry, ugly, duplicate, poorly drawn face, deformed, mosaic, artifacts, bad limbs

输入后,点击 Submit 生成图像。

高分辨率框架 HiDiffusion 运行教程,快速生成高质量 8k 图像_图像处理_09

方式二:图像生成图像

其原理是 ControlNet 在原始图像的轮廓基础上根据提示词进行图像生成。上传一张参考图片后,通过输入正向提示词与逆向提示词进行图像的生成。

 正向提示词:The Joker, high face detail, high detail, muted color, 8k

 逆向提示词:blurry, ugly, duplicate, poorly drawn, deformed, mosaic

高分辨率框架 HiDiffusion 运行教程,快速生成高质量 8k 图像_图像处理_10

高分辨率框架 HiDiffusion 运行教程,快速生成高质量 8k 图像_人工智能_11

生成图像中,第一张为原图像的轮廓,第二张为根据这个轮廓进行生成的图像。

方式三:图像修复

在进行修复时,同样根据正向提示词和反向提示此词进行修改。

高分辨率框架 HiDiffusion 运行教程,快速生成高质量 8k 图像_语言模型_12

 首先上传一张需要修复的图像以及一张修复位置标记图,修复区域中的黑色区域是冻结的区域,表示我们不需要进行修改的区域,白色区域为需要修改的区域。

高分辨率框架 HiDiffusion 运行教程,快速生成高质量 8k 图像_深度学习_13

正向提示词:A post-apocalyptic survivor in tattered clothing, with a makeshift spear, cautiously navigating through a denseforest overgrown with vines that have reclaimed a crumbling cityscape.

 逆向提示词:blurry,ugly, duplicate, poorly drawn, deformed, mosaic

 点击 Submit 后,可以看到将我们标记的修改区域按照提示词进行了修改。

高分辨率框架 HiDiffusion 运行教程,快速生成高质量 8k 图像_机器学习_14