Datawhale X 魔搭 AI夏令营第四期 AIGC （持续更新中）-CSDN博客

本文链接：https://blog.csdn.net/2302_78492008/article/details/141113728

教程内有很详细的讲解，这里就不过多赘述，主要分享一下个人的理解与体会

个人体会：

首先是夏令营方面，这次练习，主要让我学会了如何用魔塔对自己想要的图片进行生成，后面我也自己根据自己的prompt进行了训练生成，总体来说，本次任务不但让我熟悉了流程，也让我学会了如何根据自己的提示词，生成自己想要的图片。我也稍微似乎的了解了近年来，AI智能生成图片的底层代码。希望接下来的任务可以让我对这方面知识有更加充分的学习。

下面是个人生成的模型，大家可以去看一下哈

day1:

根据源文件生成的图片：

自己设置的prompt生成的图片：

图一：

torch.manual_seed(0)
image = pipe(
    prompt="二次元，一间产房内，一个男孩顺利诞生，黑色短发的爸爸、黄色长发的妈妈和带着口罩的医生们脸上都洋溢着快乐的笑容",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("2-1.jpg")

图二：

torch.manual_seed(1)
image = pipe(
    prompt="二次元，一个黑色短发的小男孩看到了一只在大树上脱壳的蝉，脸上充满了好奇，而他的爸爸在旁边开心的看着这个小男孩",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("2-2.jpg")

图三：

torch.manual_seed(2)
image = pipe(
    prompt="二次元，小学时候，在一个大树下，这个小男孩在和他的妈妈讲述他在学校认识的新朋友，妈妈面带微笑看着他",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度，色情擦边",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("2-3.jpg")

图四：

torch.manual_seed(5)
image = pipe(
    prompt="二次元，在初中的时候，这个黑色短发男孩进入了叛逆期，大声吼着妈妈",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度，扭曲的手指，多余的手指",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("2-4.jpg")

图五：

torch.manual_seed(0)
image = pipe(
    prompt="二次元，在高中的时候，这个黑色短发男孩也长大成为了男生，穿着蓝白色经典高中校服，在教室内奋笔疾书",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("2-5.jpg")

图六：

torch.manual_seed(1)
image = pipe(
    prompt="二次元，这个黑色短发男生在高考中考出了满意的成绩，考入到了自己想要考入的复旦大学，看着录取通知书，留下了激动的眼泪",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("2-6.jpg")

图七：

torch.manual_seed(7)
image = pipe(
    prompt="二次元，在大学期间，这个黑色短发男生选择了参军入伍，在艰苦的地区站岗执勤",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("2-7.jpg")

图八：

torch.manual_seed(0)
image = pipe(
    prompt="二次元，这个男生，退伍回到学校，积极参加志愿活动和比赛，利用空闲时间进行国防宣讲，鼓励同学们参军报国，真挚的眼神打动了在场的所有人",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("2-8.jpg")

day2

本次实验主要是通过AI大模型智能生成提示词，然后利用魔塔生成图片，如果平时用大模型用的多的话，本次实验就是易如反掌，这里用的是通义千问（也可以使用国外的chatGTP-4，国内的文心一言、讯飞星火等），下面是博主生成的prompt和图片。

自己设置的prompt生成的图片：

图片1：

torch.manual_seed(0)
image = pipe(
    prompt="古风，工笔画风格，一位身穿淡紫色长裙的女子，黑色长发束成发髻，头戴珠花，端坐于书桌前，专注地聆听先生授课，上半身特写，背景是木质结构的古代学堂。",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("3-1.jpg")

图片2：

torch.manual_seed(1)
image = pipe(
    prompt="古风，淡墨渲染，同一女子，依然是淡紫色长裙，头发松散，头微微倾斜，手托着脸颊，似乎在梦中微笑，上半身特写，学堂内静谧，窗外阳光斑驳",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("3-2.jpg")

图片3：

torch.manual_seed(2)
image = pipe(
    prompt="古风，水彩晕染，女子穿着淡绿色长裙，轻纱飘逸，站立于一条古道旁，身后是蜿蜒的小径与远处的山峦，全身特写，四周有几朵野花点缀",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度，色情擦边",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("3-3.jpg")

图片4：

torch.manual_seed(5)
image = pipe(
    prompt="古风，细腻线描，一位英俊的男子身着蓝金色的战袍，骑着一匹白色的骏马，马蹄轻扬，正缓缓接近女子所在的道路，背景是夕阳下的山水画卷",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度，扭曲的手指，多余的手指",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("3-4.jpg")

图片5：

torch.manual_seed(0)
image = pipe(
    prompt="古风，细腻勾勒，女子与王子并肩而立，女子穿着淡粉色长裙，手持折扇，王子身着蓝金色战袍，两人面带微笑交谈，背景是繁花似锦的园林",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024, 
)
image.save("3-5.jpg")

图片6：

torch.manual_seed(1)
image = pipe(
    prompt="古风，淡雅色调，女子侧坐于白马之上，穿着浅蓝色长裙，双手轻轻环抱王子腰间，王子驾驭着马匹，两人眼神交汇，背景是辽阔的草原与远山",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("3-6.jpg")

图片7：

torch.manual_seed(7)
image = pipe(
    prompt="古风，淡墨渲染，女子从梦中醒来，依然穿着淡紫色长裙，坐在学堂内，表情略显迷茫，上半身特写，周围的同学都在收拾书本准备离开",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("3-7.jpg")

图片8：

torch.manual_seed(0)
image = pipe(
    prompt="古风，工笔画风格，女子重新投入学习，身穿淡紫色长裙，认真阅读手中的书卷，旁边摆放着笔墨纸砚，上半身特写，学堂内其他同学也各自忙碌着",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("3-8.jpg")

结果如下：