目录
Datawhale X 魔搭 AI夏令营第四期-AIGC文生图方向
Task1:魔搭-从零入门AI生图原理&实践
0.0 一些link
⭐Task1打卡链接:
电脑端打开 https://linklearner.com/activity/14/10/24
参考笔记:
http://t.csdnimg.cn/8Dvdm
https://juejin.cn/post/7401033107807879202?share_token=573d1b10-6e53-4a48-96f1-f88365b49fca
⭐学习手册:
https://datawhaler.feishu.cn/wiki/UM7awcAuQicI4ukd2qtccT51nug
Q&A:
https://datawhaler.feishu.cn/wiki/K6b1woVtlizjV0klBBgc6ZJUnie
https://v00u9dpku63.feishu.cn/docx/CmVddNV0eoK6nCxjbmScrmTBn7d
赛事官网:
https://modelscope.cn/brand/view/Kolors?branch=0&tree=0
https://tianchi.aliyun.com/s/ce4dc8bf800db1e58d51263ff357d28f
0.1 任务内容
1.1 了解 可图Kolors-LoRA风格故事挑战赛
赛事链接: https://tianchi.aliyun.com/s/ce4dc8bf800db1e58d51263ff357d28f
比赛内容:
- 参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格…
- 基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义;基于8图故事,评估LoRA风格的美感度及连贯性
样例:偶像少女养成日记
1.2 学习 文生图基础知识
文生图(Text-to-Image Generation)是一种通过文本生成图像的技术,其发展历程可以追溯到早期的计算机视觉和自然语言处理研究。
参考:https://www.yuque.com/login?goto=https%3A%2F%2Fwww.yuque.com%2Foffice%2Fyuque%2F0%2F2024%2Fpptx%2F1169882%2F1720431794935-a1a33ec5-e784-4b6e-9664-8f459e2c7413.pptx%3Ffrom%3Dhttps%253A%252F%252Fwww.yuque.com%252F2ai%252Fmodel%252Fgutsk9ezeymuebq9
1.2.1 发展阶段:
- 早期探索(20世纪60年代-20世纪90年代)
文生图的概念最早出现于计算机视觉和图像处理的早期研究中。
早期的图像生成技术主要依赖于规则和模板匹配,通过预定义的规则将文本转换为简单的图形。
然而,由于计算能力和算法的限制,这一阶段的技术能力非常有限,生成的图像质量较低,应用场景也非常有限。 - 基于统计模型的方法(2000年代)
进入2000年代,随着统计模型和机器学习技术的