”言出法随“最懂你的AI绘画工具,无需关键词、一键整合包教程

2024年,AI绘画技术已经日新月异,但仍有不少工具依赖于关键词描述,无论是Midjourney还是Stable Diffusion,都需要用户提供详细的关键词描述。尽管聪明的用户可以借助大语言模型(如GPT-4)自动生成关键词,但这仍旧不是最直观的方式。

今天,我们要介绍的是Omost——一个真正理解你的AI绘画工具。

github项目,stars飙升。

2ae0faab38b13c1f293c0d24b9da5087.jpeg

Omost不仅是ControlNet作者倾力打造的创新项目,更是一场图像生成技术的革命。Omost通过将大型语言模型(LLM)的强大编码能力转化为直观且高效的图像生成能力,带来了前所未有的创作体验。


Omost的独特之处

Omost的核心技术在于其独特的图像合成方法,能够深刻理解并响应极短的提示词,生成既详细又空间表现准确的图像。这意味着即使你对图像生成技术不甚了解,也能轻松生成令人惊叹的视觉作品。

项目名称“Omost”寓意深远,其中“O”代表“omni”多模态,象征着项目支持多种形式的输入与输出;“most”则表达了项目挖掘LLM模型潜力的决心,力求从每一个细节中释放出最多的图像生成可能性。


技术亮点

  1. 自动扩展提示词:Omost能够将简单的提示词拆解成详细的描述,生成符合你预期的完整图像。
  2. 高灵活性:生成的图像可以轻松调整,用户可以通过简单的提示词对图像中的某个元素进行修改。
  3. 图像位置编码:通过将图像划分为729个不同的位置,确保生成图像的准确性和细致度。
  4. 子提示系统:Omost的LLM可以提供严格定义的“子提示”,大幅提高提示词的灵活性和准确性。
  5. 注意力操纵:通过调整注意力分数,Omost能够实现更精细的图像生成。
  6. 提示前缀树:通过提示前缀树技术改进提示理解和描述,确保生成图像与提示词高度一致。


Omost的应用

Omost的背后是经过混合数据训练的LLM模型,这些模型不仅能够编写代码,还能与内置的虚拟画布代理紧密协作。用户只需简单描述所需画面,虚拟画布代理便会理解并转化为视觉指令代码,并最终生成符合要求的图像。

更为重要的是,你可以将Omost生成的关键词复制到其他AI绘画软件中,比如Stable Diffusion,同样能够生成酷炫的效果。



获取指南

  1. 一键启动:无需复杂配置,下载后解压直接点击 一键启动.exe,即可启动程序。
  2. 下载速度取决于您的网速,无需开通会员。
公  众  呀!

InnoTechX
ce73362d2c4a12a668c1b7c582713378.jpeg


发送

e0736fd5976002f33c738936f116d056.jpeg



前置条件

此一键包win10、win11可用,并且需要配备至少8GB显存的 NVIDIA 显卡。cuda版本需要大于等于12.1,如果cuda版本小于12.1,可以按照教程按装指定版本的cuda [https://www.zhisk.com/1154.html]。

cuda查询cmd指令

nvcc –version

或:

nvidia-smi

(请注意某些 9XX 或 10XX 或 20XX GPU 可能无法正常运行,具体自测)



使用步骤

  1. 下载并解压整合包到本地目录。
  2. 进入目录后,点击 一键启动.exe 启动程序。
  3. 注意:程序运行期间,请勿关闭 CMD 命令窗口。
c4a2a9fef41da2549213223973b7cbc0.jpeg

点击启动后会自动打开网页跳转到 http://localhost:7860/ 没有就自行复制到浏览器打开

13e570444ba6a543bee743a1e97d3175.jpeg

只需要简单描述一下你想要绘画的内容,中文和英语都可以,submit点击提交,等待左侧Render the Image!按钮出现,再次点击Render the Image!就会开始绘画了
7a60e9b6e03c092a2a2bff0bd5ecbc81.jpeg

生成结果

70ac0ceacd885fa9f9433ed27e1a8034.jpeg

你也可以将已经生成的视觉内容的关键词复制到Stable Diffusion中去绘画,比如我随便找了一个在线Stable Diffusion平台

将tags内容复制过去

7bdac26b3560caad30d2226ec557526f.jpeg

0533dd559f546f09b783f7457be602ce.jpeg

这平台免费的还要排队,无语,第一次生成等了半天,还给我吃了。

f7cbacb3b3f96639d545c00ea3671c4e.jpeg

6bc6b987e4258e63dafa18569238c5c9.jpeg

再次排队后生成,再等待了九九八十一分钟后,终于出图了。

cedbb6db8b4e60491b80a65a7ebfe8fb.jpeg


真是受不了这平台,等待太慢。共用GPU服务器资源还是垃圾,自己显卡好情愿用自己电脑跑。


下期文章还是出一个Stable Diffusion的极简中文离线整合包以及优质真人模型推荐。



  • 6
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值