AI 美甲生成器|训练笔记

 5c6e048eae6665bb743754a97d5ff8e5.jpeg

by: 周末 & 海辛

和@周末 基于 Stable Diffusion 进行训练,做出了一款由文字生成美甲图案的 AI 美甲生成器,以下是一些生成成果。

aceca78bf96ce726f871fd1f35c62b03.png

Fine tune 模型的训练其实并不难,目前有很多基于 Stable Diffusion 的 fine tune pipeline,也多半会提供一个 end-to-end 的 notebook 给用户使用。

理论上只需要指向自己的数据集就可以点运行运行运行,然后高枕无忧地等着模型训练好上传到 Hugging Face。但天下哪有不出 bug 的 e2e pipepline,更遑论各种环境都装的完美顺畅的便宜云服务器。碰上报错只能勉勉强强查查,正所谓 Stack Overflow 是我的(社区)大学,GitHub issues 是我的售后热线(x

d2a359e3b43bc0bd5452f20dcc936370.png

在整个训练的过程中,最重要的还是准备数据集,在美甲的数据集中,需要对抓取的图片进行预处理去除无关信息并保证统一的版式,这是最耗费精力也是对训练影响最大的部分。

其次是图片的描述,因为 SD 是监督学习,所以必须给每张图片打上准确合适的标签,提供给SD来理解语义与图像之间的关联。

c94016b4ae30c1f40da8f78e0543f3b4.png

我们借助了另一个机器学习模型 BLIP 来给图片打 label,BLIP 感觉是一个一周工作 100 小时的社畜,经常在描述语里自言自语和咆哮,比如:


a bunch of fake nails with flowers on them, inspired by Louis Comfort Tiffany, cloisonnism, ffxiv heavensward, is this loss?, ebay listing thumbnail, presenting magic gem, earth tones, vases and bottles, the last guardian skinny towers, aesthetic!!!!!!!!!!

以及,

black and white stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil, an airbrush painting, cobra, nail art, the dress's lower, pale white detailed reptile skin, posable pvc, talons, panels

(这种醉汉模式的标注力真的让人一言难尽,如果重来一次我会选择 Clip Interrogator)

19ec4e51db86a3961f6286d6d591832c.png

我们对 Blip 标注的内容进行了人工的清理和修正后,就都丢给 stable diffusion 开始学习了。

进度条往前跑,每训练一些步数,模型就会 dump 出效果图,一开始它做出来的图是这样的:

1f0948844985ac85aa97292a64bb20af.png

努力学习之后它做出来的图就变成了:

0131e9e98235d4f157978c21ef575bf4.png

看着效果图从莫名其妙到走上正轨还挺有趣的,是一种不断有正反馈的体验,意外地很有成就感。

等到最终训练完成,我们会得到一个 14GB 的 checkpoint,记录所有模型的参数。下载存储都很费时间和空间。好在可以将其转换为 HF 的 diffusers,所需的储存空间会大大降低,并且可以直接调用 diffusers 的 API 来测试生成图片,比 SD 自带的 text2img 脚本要方便很多。

最终模型和 Demo 在 Hugging Face 上发布,并且在 Twitter 上得到了 Hugging Face 官号的转发。

e1cdbbe1c66fff20af73b72417566a2a.png

Hugging Face 是机器学习届的 GitHub , 有非常良好的社区氛围,在制作美甲模型的过程中,Hugging Face 的 Stuff - AK 和 Patrick von Platen,都有帮助我们。(直到发布许久后还会提意见,多少有一些被暖  juan 到。)

除此以外 Hugging Face 上有 无限的存储空间 用于上传模型;Database, 模型和 Space 之间的互相索引也做得很好;还可以使用 Gradio 或 Streamlit 很方便地制作前端 demo 的 UI;最近还上线了 Tasks 帮助用户进行实用机器学习入门。 

我觉得 Hugging Face 是 showcase 自己的 AI 模型以及向 AI 界其他人学习的最好的场合。

aa0bd2ccfc5a2081f094a8deb594f887.png

上传好模型后,我 Duplicate Space 了 Hugging face 上 text to pokemon Space,在此基础上改为调用 Nail Set Diffuser 的模型,从而快速地做出了 AI 美甲生成器的 UI 界面。

这样其他用户皆可通过该界面快速生成美甲,GPU 也是使用的 Hugging Face 提供的云端 GPU. (有免费的 GPU 可供选择,但越贵的 GPU 速度会越快)

2254e95269e8a1bd4d2b006992567e18.png

>> 模型下载地址:

https://huggingface.co/ringhyacinth/nail-set-diffuser

>> Hugging Face Space:https://huggingface.co/spaces/ringhyacinth/Nail-Diffuser

最后分享几张其他用户的测试成果:

6ce3655d0485c5e96f622c4c931e5032.png

a5bd2d61f7cb52b06b86ad717e604862.png

787c08db45386632853660e2a0ea1396.png

7e0dc20c72059c29bfb909667421415e.png

fac3387a31edc5024045bea0c17eaa43.png

6af31747014a8683753ee7f2a4561aeb.png

fad6277435d66b34cd9a928f87c7d01f.png

希望本文能为你提供帮助,如果你是女性,也欢迎你加入我们的 女性 AI 艺术学习小组 共同实验 AI 艺术的可能性,请通过 全民熊猫计划公众号后台 留言告诉我你的联系方式。Thanks ♪(・ω・)ノ 

......

8d52326f3a9d0ccfaca879c7b62595e1.png

opus

欢迎加入社群,留言讨论,参与 AIGC & 元宇宙 话题的共创~

86589155660b9de4a4cddc7c1f76e4ce.png


添加请备注
AIGC & 元宇宙

💡

b693b2b9e710430b9839592691919afb.png

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值