Datawhale X 魔搭 AI夏令营第四期 AIGC方向 task01笔记

文生图

文生图(Text-to-Image Generation)是一种通过文本生成图像的技术
文生图

BASELINE 体验

1. 魔塔绑定阿里云

2. 报名天池比赛

可图Kolors-LoRA风格故事挑战赛

3. Data Science Workshop

4. 体验baseline

  1. 打开 Terminal,使用 Git 下载 baseline 文件
git lfs install
git clone https://www.modelscope.cn/datasets/maochase/kolors.git
  1. 进入 kolors 文件夹,打开baseline.ipynb文件

  2. 安装环境
    baseline.ipynbshift + enter运行第一个代码块,安装 Data-JuicerDiffSynth-Studio

    • Data-Juicer:数据处理和转换工具,旨在简化数据的提取、转换和加载过程
    • DiffSynth-Studio:高效微调训练大模型工具
    !pip install simple-aesthetics-predictor
    
    !pip install -v -e data-juicer
    
    !pip uninstall pytorch-lightning -y
    !pip install peft lightning pandas torchvision
    
    !pip install -e DiffSynth-Studio
    
  3. 重启 kernel

  4. 调整 prompt

    • 正向描述词:你想要生成的图片应该包含的内容
    • 反向提示词:你不希望生成的图片的内容
  5. 训练模型并生成图片

5. 模型上传魔塔

  1. terminal 移动 output 文件夹
mkdir /mnt/workspace/kolors/output & cd 
cp /mnt/workspace/kolors/models/lightning_logs/version_0/checkpoints/epoch\=0-step\=500.ckpt /mnt/workspace/kolors/output/
cp /mnt/workspace/kolors/1.jpg /mnt/workspace/kolors/output/
  1. 下载 output 文件夹中的两个文件
  2. 创建并上传模型所需内容

6. 关闭PAI实例

7. 成图

1
2
3

4
5
6
7
8


相关链接

  1. Datawhale活动页面
  2. AIGC专题视频课程
  3. AIGC专题品牌馆
  4. 模型训练入口
  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值