因为对baseline的代码很感兴趣,于是我先利用通义完成了对代码的解读
①精读baseline
先了解一下baseline的框架
然后通过通义将代码分成几个part
具体结果步骤上有,我就不展示了
因为对代码了解基础为0,所以我又问了一些很基础的问题
通义的回复也很简洁明了
对这些工具/库有了基础的了解,我又问了一些自己感兴趣的问题,具体就不展示了,我将这些做了个总结,如下:
因为上传文件有限制,所以有点糊,我放大截屏 了几张
②修改数据集(失败的尝试)
因为出图画风不理想,所以我尝试的按照通义给的代码将lora下载的数据集替换成自己的数据集
但是过程中出现了很多错误
前面的两个问题是代码格式的错误,通过通义解决了,但是第三个问题改了好几遍,但是仍然报错,不知道怎么解决。
所以这次尝试失败了,后续我再努力努力看看能不能实现。
③利用通义进行连环画制作
我先是利用通义进行了提示词的生成
然后再根据效果图进行修改,比如头发颜色和衣服,以及一些细节
经过多次修改prompt,终于得到了最后的图片
女孩在街道上漫步
奇怪的声响引起了女孩注意
一只被淋湿的小猫从角落里钻了出来
女孩蹲下来,将伞分给小猫一半,试图伸手抚摸小猫
小猫貌似被吓到跑走了
女孩很失落
突然,女孩在水中的倒影里发现了突如其来的鲜花
原来小猫没有跑走,只是捡了花来报答女孩,女孩开心得抱住小猫
图片大致能连起来,但是仍然出现一些问题。
①撑伞这个动作无法达成,伞很突兀的出现在背后或者其他问题
②提示词不能完全实现,输入的是地上是一朵花然后图片里却呈现了满地的花
③画风不统一,女孩是二次元画风,动物偏向写实(这也是我想换数据集的原因)
总得来说这次学习还是收获颇丰,希望在后续的学习中能够解决这些问题(˃ ⌑ ˂ഃ )