Datawhale X 魔搭 AI夏令营——task1

        第一次听说AIGC,原来现在比较或的AI生图就是这个东东,我之前看过一点点卷积网络的相关知识,理解神经网络将一张三个通道的图片越卷越深,最后将输入拉成一个维度非常深的向量的过程,但是我一直没想过神经网络是如何根据一个很深的向量得到一幅图片的过程,之前的训练过程可以是一幅图片对应一个标签,那现在就是一个向量对应许许多多幅图片了,所以对于AI生图我还真就是一头雾水。

        有关理论的部分,全是数学原理,这就让我这个数学渣渣破了防,只能说我的水平只够看看简介部分;关于拓展部分,我没咋看懂,就是发现AIGC的训练过程和普通的卷积神经网络等的训练过程没啥区别啊,就是多了一些和图片相关的参数,比如对比度、分辨率之类的,我还是想知道一下它的网络构成与原理(不是单纯的数学原理,要是能有更多的图解就好了)。

        然后下面是我自己跑出来的效果,我本来是想画一个商鞅南门立木连环画的,但是我在prompt里面怎么删减增加语句,最后生成的图片都没有太大的变化,然后我又在negative_prompt里面加上我不想出现的,模型跑出来还是没太大变化,就比如这第一幅图片,商鞅在朝廷力排众议要求变法,秦王在宝座上沉思,但我强调人要多,人不要面朝屏幕,面无表情,但似乎没啥用,而且第一幅图里面好像没有商鞅。。。

 紧接着商鞅在城门口宣布新的法律法规,百姓们议论纷纷,这里我觉得人还是少了,商鞅也没有开口。

然后到了南门立木的阶段了,这里我想的是百姓一直在喧闹,商鞅镇定自若,但这里好像没看到百姓们。

然后一名百姓突然从人群中站出,询问着商鞅是否说话算数,这里人还是少了。

然后那名百姓就扛着木头走了,这里这根木头就是凭空悬浮起来的,但是人够。

然后那名百姓放下木头,商鞅很高兴,准备命令身后的随从将一小麻布袋递给那名百姓,这里除了高兴和麻布袋,其余的和我文本中描述的差的很多,比如随从是哪个,百姓身旁就是没有木头(生成了很多次,就是没有木头)。

拿到金子的百姓很吃惊,周围的百姓们像炸开了锅,商鞅不断向周围的百姓们宣讲着自己坚决信守承诺。

 最后就是秦国举国上下一心,实力大增(我的描述词是朝廷的人都很开心,大臣们敬重大王,大王嘉奖着功臣,但是这里没有出现与嘉奖相关的画面诶)

好了,上面就是我对第一节的baseline的全部理解和实践啦。 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值