最近在逛github的时候,发现了一个有意思的项目,通过输入文字,经过一个扩散模型pipline,最终生成一张360全景图像,初见觉得很有意思,细想却不知道这种应用到底有何用处,各位同学也可以借此思考下,在各种T2I,I2I大模型遍地都是的时代,什么样的模型应用才有出路。
既然都开篇了,还是给大家介绍下这个项目的使用情况。
项目地址:ArcherFMY/SD-T2I-360PanoImage: repository for 360 panorama image generation based on Stable Diffusion (github.com)
项目部署:手下还是创建一个虚拟环境,然后安装requirements.txt中的依赖包。
模型下载:根据项目的介绍,在huggingface或者网盘可以下载相应的模型,包括SD基础模型,i2p 模型,等等。
项目激活:激活虚拟环境,然后运行demo_t2p.py
进入到demo_t2p.py这个python文件,修改prompt或者将prompt修改为一个系统参数的输入sys.argv[1].
首先我们生成一张大海的360全景图片