基于扩散模型的文字生成360度全景图像

本文介绍了GitHub上一个利用扩散模型将文字转化为360度全景图像的项目。通过安装依赖、下载模型并运行代码,可以观察到模型将文字指令转化为不同场景的全景图,其中包括一些有趣的错误结果。尽管目前应用前景不明朗,但该项目展示了AI生成内容的潜力,预示着2024年将是模型应用竞争激烈的一年。
摘要由CSDN通过智能技术生成

最近在逛github的时候,发现了一个有意思的项目,通过输入文字,经过一个扩散模型pipline,最终生成一张360全景图像,初见觉得很有意思,细想却不知道这种应用到底有何用处,各位同学也可以借此思考下,在各种T2I,I2I大模型遍地都是的时代,什么样的模型应用才有出路。

既然都开篇了,还是给大家介绍下这个项目的使用情况。

项目地址:ArcherFMY/SD-T2I-360PanoImage: repository for 360 panorama image generation based on Stable Diffusion (github.com)

项目部署:手下还是创建一个虚拟环境,然后安装requirements.txt中的依赖包。

模型下载:根据项目的介绍,在huggingface或者网盘可以下载相应的模型,包括SD基础模型,i2p 模型,等等。

项目激活:激活虚拟环境,然后运行demo_t2p.py

进入到demo_t2p.py这个python文件,修改prompt或者将prompt修改为一个系统参数的输入sys.argv[1].

首先我们生成一张大海的360全景图片

04e38d85c791200eea5c425f76210610.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值