基于扩散模型的文字生成360度全景图像

最新推荐文章于 2024-06-17 00:00:07 发布

「已注销」

最新推荐文章于 2024-06-17 00:00:07 发布

阅读量469

点赞数 4

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wutao22/article/details/135493393

版权

本文介绍了GitHub上一个利用扩散模型将文字转化为360度全景图像的项目。通过安装依赖、下载模型并运行代码，可以观察到模型将文字指令转化为不同场景的全景图，其中包括一些有趣的错误结果。尽管目前应用前景不明朗，但该项目展示了AI生成内容的潜力，预示着2024年将是模型应用竞争激烈的一年。

摘要由CSDN通过智能技术生成

最近在逛github的时候，发现了一个有意思的项目，通过输入文字，经过一个扩散模型pipline，最终生成一张360全景图像，初见觉得很有意思，细想却不知道这种应用到底有何用处，各位同学也可以借此思考下，在各种T2I，I2I大模型遍地都是的时代，什么样的模型应用才有出路。

既然都开篇了，还是给大家介绍下这个项目的使用情况。

项目地址：ArcherFMY/SD-T2I-360PanoImage: repository for 360 panorama image generation based on Stable Diffusion (github.com)

项目部署：手下还是创建一个虚拟环境，然后安装requirements.txt中的依赖包。

模型下载：根据项目的介绍，在huggingface或者网盘可以下载相应的模型，包括SD基础模型，i2p 模型，等等。

项目激活：激活虚拟环境，然后运行demo_t2p.py

进入到demo_t2p.py这个python文件，修改prompt或者将prompt修改为一个系统参数的输入sys.argv[1].

首先我们生成一张大海的360全景图片

最低0.47元/天解锁文章

「已注销」

关注

4
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。