Datawhale X 魔搭 AI夏令营 第四期 AIGC (持续更新中)

参考教程:Datawhale (linklearner.com)

教程内有很详细的讲解,这里就不过多赘述,主要分享一下个人的理解与体会

个人体会:

首先是夏令营方面,这次练习,主要让我学会了如何用魔塔对自己想要的图片进行生成,后面我也自己根据自己的prompt进行了训练生成,总体来说,本次任务不但让我熟悉了流程,也让我学会了如何根据自己的提示词,生成自己想要的图片。我也稍微似乎的了解了近年来,AI智能生成图片的底层代码。希望接下来的任务可以让我对这方面知识有更加充分的学习。

下面是个人生成的模型,大家可以去看一下哈

day1:

根据源文件生成的图片:

自己设置的prompt生成的图片:

图一:

torch.manual_seed(0)
image = pipe(
    prompt="二次元,一间产房内,一个男孩顺利诞生,黑色短发的爸爸、黄色长发的妈妈和带着口罩的医生们脸上都洋溢着快乐的笑容",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("2-1.jpg")

图二:

torch.manual_seed(1)
image = pipe(
    prompt="二次元,一个黑色短发的小男孩看到了一只在大树上脱壳的蝉,脸上充满了好奇,而他的爸爸在旁边开心的看着这个小男孩",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("2-2.jpg")

图三:

torch.manual_seed(2)
image = pipe(
    prompt="二次元,小学时候,在一个大树下,这个小男孩在和他的妈妈讲述他在学校认识的新朋友,妈妈面带微笑看着他",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度,色情擦边",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("2-3.jpg")

图四:

torch.manual_seed(5)
image = pipe(
    prompt="二次元,在初中的时候,这个黑色短发男孩进入了叛逆期,大声吼着妈妈",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度,扭曲的手指,多余的手指",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("2-4.jpg")

图五:

torch.manual_seed(0)
image = pipe(
    prompt="二次元,在高中的时候,这个黑色短发男孩也长大成为了男生,穿着蓝白色经典高中校服,在教室内奋笔疾书",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("2-5.jpg")

图六:

torch.manual_seed(1)
image = pipe(
    prompt="二次元,这个黑色短发男生在高考中考出了满意的成绩,考入到了自己想要考入的复旦大学,看着录取通知书,留下了激动的眼泪",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("2-6.jpg")

图七:

torch.manual_seed(7)
image = pipe(
    prompt="二次元,在大学期间,这个黑色短发男生选择了参军入伍,在艰苦的地区站岗执勤",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("2-7.jpg")

图八:

torch.manual_seed(0)
image = pipe(
    prompt="二次元,这个男生,退伍回到学校,积极参加志愿活动和比赛,利用空闲时间进行国防宣讲,鼓励同学们参军报国,真挚的眼神打动了在场的所有人",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("2-8.jpg")

day2

本次实验主要是通过AI大模型智能生成提示词,然后利用魔塔生成图片,如果平时用大模型用的多的话,本次实验就是易如反掌,这里用的是通义千问(也可以使用国外的chatGTP-4,国内的文心一言、讯飞星火等),下面是博主生成的prompt和图片。

自己设置的prompt生成的图片:

图片1:

torch.manual_seed(0)
image = pipe(
    prompt="古风,工笔画风格,一位身穿淡紫色长裙的女子,黑色长发束成发髻,头戴珠花,端坐于书桌前,专注地聆听先生授课,上半身特写,背景是木质结构的古代学堂。",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("3-1.jpg")

图片2:

torch.manual_seed(1)
image = pipe(
    prompt="古风,淡墨渲染,同一女子,依然是淡紫色长裙,头发松散,头微微倾斜,手托着脸颊,似乎在梦中微笑,上半身特写,学堂内静谧,窗外阳光斑驳",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("3-2.jpg")

图片3:

torch.manual_seed(2)
image = pipe(
    prompt="古风,水彩晕染,女子穿着淡绿色长裙,轻纱飘逸,站立于一条古道旁,身后是蜿蜒的小径与远处的山峦,全身特写,四周有几朵野花点缀",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度,色情擦边",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("3-3.jpg")

图片4:

torch.manual_seed(5)
image = pipe(
    prompt="古风,细腻线描,一位英俊的男子身着蓝金色的战袍,骑着一匹白色的骏马,马蹄轻扬,正缓缓接近女子所在的道路,背景是夕阳下的山水画卷",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度,扭曲的手指,多余的手指",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("3-4.jpg")

图片5:

torch.manual_seed(0)
image = pipe(
    prompt="古风,细腻勾勒,女子与王子并肩而立,女子穿着淡粉色长裙,手持折扇,王子身着蓝金色战袍,两人面带微笑交谈,背景是繁花似锦的园林",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024, 
)
image.save("3-5.jpg")

图片6:

torch.manual_seed(1)
image = pipe(
    prompt="古风,淡雅色调,女子侧坐于白马之上,穿着浅蓝色长裙,双手轻轻环抱王子腰间,王子驾驭着马匹,两人眼神交汇,背景是辽阔的草原与远山",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("3-6.jpg")

图片7:

torch.manual_seed(7)
image = pipe(
    prompt="古风,淡墨渲染,女子从梦中醒来,依然穿着淡紫色长裙,坐在学堂内,表情略显迷茫,上半身特写,周围的同学都在收拾书本准备离开",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("3-7.jpg")

图片8:

torch.manual_seed(0)
image = pipe(
    prompt="古风,工笔画风格,女子重新投入学习,身穿淡紫色长裙,认真阅读手中的书卷,旁边摆放着笔墨纸砚,上半身特写,学堂内其他同学也各自忙碌着",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=4,
    num_inference_steps=50, height=1024, width=1024,
)
image.save("3-8.jpg")

结果如下:

day3

教程链接:Datawhale (linklearner.com)

个人体会:基本按照教程一步步进行操作,然后大家可以在提示第3步骤中的提示词中进行一下测试,然后就是更改自己的Lora地址(目前博主也不知道如何去找,等今天晚上直播完,博主在进行更新哦)

下面是博主自己改了提示词(二次元,古风,水墨画,一个黑色短发男孩,坐在教室里,下课铃声响了,同学们开始走动,从睡梦中醒来,深思,上半身,黑色上衣)后生成的图片:

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值