本期夏令营主要任务是微调大模型、改变提示词、数据集,生成出图片,进而将图片串联成一个故事。而task1则提供了一个基础的baseline,利用lora模型生成自己的图片。
Baseline中我学到了什么
Data-Juicer 和 DiffSynth-Studio是微调的基础工具
Prompt是图片生成的灵魂所在,选用合适的Prompt可以生成令人满意的结果
同时,可以通过更改参数以实现图片大小的改变
实践中遇到的问题与解决方法
- 遇到报错的解决方法:先看报错类型,然后通过排查报错原因-重启内核-重建实例的方式进行Debug
- Prompt要求生成多人图片,但生成结果不理想,甚至十分鬼畜:可以通过加入多人图片进入数据集,让机器学习到人物空间中相对关系的特征
总结
task1的任务还是十分简单的,但是给了我整个任务的insight。在后期的学习中,我计划研究模型微调的工具与Prompt工程,并对整个训练集进行扩充。希望能得到一套更精美的图片与更有逻辑的故事