参考:
https://blog.csdn.net/weixin_42357472/article/details/140666936
测试下来lable用中文微调好像没有英文效果好,建议还是label用英文好点
1)数据集:
下载:
https://huggingface.co/datasets/svjack/pokemon-blip-captions-en-zh
使用处理数据集参考:https://blog.csdn.net/weixin_42357472/article/details/140144141
处理成DiffSynth-Studio框架格式,这里选取50张做微调
主要前两列,这是训练的英文label
2)训练
CUDA_VISIBLE_DEVICES=0 python exa