混元DiT文生图大模型本地离线体验

前段时间腾讯的混元大模型开源了,据说是具备双语生成能力,对中国元素的理解能力非常强,于是带着好奇心花了点时间部署在本地跑了下看看。

 

 

6062f73717600ed3ed3f3994f0ee3212.png

 

中英双语生成

测试了下英文提示词,生成的图片意思对了。(不过这物件应该不对吧,电视机怎么看着像电脑?)

A cyberpunk style lab with some beakers in the lab, and a TV and an xbox

 

 

9c612567cc03ad5699634d74cf60ed26.png

 

再来个用中文的提示词试试

一副山水画,一座寺庙, 在高山上。

 

c3dc20b98354cd3933b8c795d0a38754.png

 

生成的效果还不错。混元大模型还能用诗词或者俗语来生成图片。

 

枯藤老树昏鸦,小桥流水人家

 

 

76fc69bc3ee89c1eee61cdf4e0e91181.png

 

明月几时有,把酒问青天

 

8157e2bb90d02e009fdb5f0fc9c2c58b.png

 

明月几时有有了,但是后半句在生成的图片中没看到...

 

尝试了其他几个,比如菜名,景区名。

 

臭豆腐

 

4dc91ce91716545440ea25297a91d040.png

 

九寨沟

 

 

d9621cc24bbc43cc14290d0ca409f7ae.png

细节能力

官方说混元大模型能够理解文本中的细节,并绘制相应的图片。我尝试了几个提示词,总的表现还不错。

 

太阳微微升起,花园里的玫瑰花瓣上露珠晶莹剔透,一只瓢虫正在爬向露珠,背景是清晨的花园,微距镜头。

 

 

dd5a6c14b8bd2322dcbe3d74160014fe.png

 

湖水清澈,天空湛蓝,阳光灿烂。一只优雅的白天鹅在湖边游泳。它周围有几只小鸭子,看起来非常可爱,整个画面给人一种宁静祥和的感觉。

 

d4954be18d655dfe16a2e080809b9102.png

 

风格是写实,画面主要描述一个亚洲戏曲艺术家正在表演,她穿着华丽的戏服,脸上戴着精致的面具,身姿优雅,背景是古色古香的舞台,镜头是近景

 

74a59b774573e374ad9850b6e0c28478.png

 

 

该项目至少需要11G的显存来运行,但我在2080,8G显存的电脑上也可以运行,不过是非常慢!低配的同学如果不怕费时间的话可以玩玩看!

 

点击下方公众号,发送【混元】关键字获取整合包。

b2cfbd6485c347d48f1798df27a19eb3.png

制作不易,如果本文对您有帮助,还请点个免费的赞或在看!感谢您的阅读!

 

  • 9
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值