Datawhale X 魔搭 AI夏令营 - AIGC文生图方向 task02笔记

系列文章目录

Datawhale AI夏令营第四期魔搭- AIGC文生图方向 task01笔记-CSDN博客


目录

系列文章目录

前言

一、学习小帮手

二、零入门AI生图

1.学习baseline + 助手辅助

2.基于话剧的连环画制作

总结

参考资料


前言

提示:这里可以添加本文要记录的大概内容:

例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。


一、学习小帮手

        俗话说:工欲善其事必先利其器。在学习之前推荐两款学习工具:通义千文、豆包。两者都是具有信息查询、语言理解、文本创作等多能力的AI助手。在学习可以帮助小伙帮提高工作效率。

比如:

还比如:

二、零入门AI生图

1.学习baseline + 助手辅助

        首先通读代码,标记处不同的代码; 其次借助辅助助手(通义千文)把不明白的代码搞明白;再则控制变量调参。

比如:最简单的cfg_scale=1:从1逐渐变大会是什么效果?;num_inference_steps=1100:从1变到1100,又会有什么效果?随机种子torch.manual_seed(0),又是起到什么作用。

torch.manual_seed(0)
image = pipe(
    # prompt="二次元,一个紫色短发小女孩,在家中沙发上坐着,双手托着腮,很无聊,全身,粉色连衣裙",
    prompt="二次元,一个金色短发小男孩,在沙发上双腿盘坐,右手上拿着勺子,腿上放有半个西瓜,看电视",
    negative_prompt="丑陋、变形、嘈杂、模糊、低对比度",
    cfg_scale=1,
    num_inference_steps=1100, height=640, width=640,
)

比如稍微多一点难度的:弄明白每个参数对训练效果有什么影响(本人还在调参中哈哈,感觉免费的东西就只能)

options:
  -h, --help            show this help message and exit
  --pretrained_unet_path PRETRAINED_UNET_PATH
                        Path to pretrained model (UNet). For example, `models/
                        kolors/Kolors/unet/diffusion_pytorch_model.safetensors
                        `.
  --pretrained_text_encoder_path PRETRAINED_TEXT_ENCODER_PATH
                        Path to pretrained model (Text Encoder). For example,
                        `models/kolors/Kolors/text_encoder`.
  --pretrained_fp16_vae_path PRETRAINED_FP16_VAE_PATH
                        Path to pretrained model (VAE). For example,
                        `models/kolors/Kolors/sdxl-vae-
                        fp16-fix/diffusion_pytorch_model.safetensors`.
  --lora_target_modules LORA_TARGET_MODULES
                        Layers with LoRA modules.
  --dataset_path DATASET_PATH
                        The path of the Dataset.
  --output_path OUTPUT_PATH
                        Path to save the model.
  --steps_per_epoch STEPS_PER_EPOCH
                        Number of steps per epoch.
  --height HEIGHT       Image height.
  --width WIDTH         Image width.
  --center_crop         Whether to center crop the input images to the
                        resolution. If not set, the images will be randomly
                        cropped. The images will be resized to the resolution
                        first before cropping.
  --random_flip         Whether to randomly flip images horizontally
  --batch_size BATCH_SIZE
                        Batch size (per device) for the training dataloader.
  --dataloader_num_workers DATALOADER_NUM_WORKERS
                        Number of subprocesses to use for data loading. 0
                        means that the data will be loaded in the main
                        process.
  --precision {32,16,16-mixed}
                        Training precision
  --learning_rate LEARNING_RATE
                        Learning rate.
  --lora_rank LORA_RANK
                        The dimension of the LoRA update matrices.
  --lora_alpha LORA_ALPHA
                        The weight of the LoRA update matrices.
  --use_gradient_checkpointing
                        Whether to use gradient checkpointing.
  --accumulate_grad_batches ACCUMULATE_GRAD_BATCHES
                        The number of batches in gradient accumulation.
  --training_strategy {auto,deepspeed_stage_1,deepspeed_stage_2,deepspeed_stage_3}
                        Training strategy
  --max_epochs MAX_EPOCHS
                        Number of epochs.
  --modelscope_model_id MODELSCOPE_MODEL_ID
                        Model ID on ModelScope (https://www.modelscope.cn/).
                        The model will be uploaded to ModelScope automatically
                        if you provide a Model ID.
  --modelscope_access_token MODELSCOPE_ACCESS_TOKEN
                        Access key on ModelScope (https://www.modelscope.cn/).
                        Required if you want to upload the model to
                        ModelScope.

2.基于话剧的连环画制作

编排一个由8张场景图片组成的连环画,(各位猜猜提示词😄)

(备注:细节和颜色搭配都有待后续微调)


总结

昨夜西风凋碧树,独上高楼,望尽天涯路。(此处)

衣带渐宽终不悔,为伊消得人憔悴。

众里寻他千百度,蓦然回首,那人却在灯火阑珊处。

参考资料

Datawhale

  • 4
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值