当前手头上的定制化项目,可用训练数据较少,训练的模型效果不佳。所以通过 clip-interrogator 获取图片获取描述后,批量进行 文生图 以增加样本量。
在批量生成前,先简单评测一下当前的主流 文生图 模型。直接上效果:
MidJourney:
https://huggingface.co/spaces/mukaist/Midjourney
优点:基本上能完美复制参考图的场景设定
缺点:多人时,人脸有崩的问题, 不支持中文;闭源&付费

当前手头上的定制化项目,可用训练数据较少,训练的模型效果不佳。所以通过 clip-interrogator 获取图片获取描述后,批量进行 文生图 以增加样本量。
在批量生成前,先简单评测一下当前的主流 文生图 模型。直接上效果:
MidJourney:
https://huggingface.co/spaces/mukaist/Midjourney
优点:基本上能完美复制参考图的场景设定
缺点:多人时,人脸有崩的问题, 不支持中文;闭源&付费

419
959

被折叠的 条评论
为什么被折叠?