MediaPipe支持人脸识别、目标检测、图像分类、人像分割、手势识别、文本分类、语音分类。每个模块都有对应的模型,但是原有模型可能比较大、推理耗时比较长,我们可以自定义模型来进行进行优化。
目录
一、训练准备
1、准备数据
1.1 原始数据
1.2 标注数据
2、简化模型
2.1 减少标签
2.2 剪裁边缘
2.3 模型复用
3、训练迭代
二、目标检测训练
1、准备安装包
2、准备数据集
3、加载数据集
4、训练模型
5、验证模型
6、导出模型
一、训练准备
1、准备数据
在自定义模型前,准备两种数据:原始数据、标注数据。
1.1 原始数据
找到足够多的数据去训练模型比较具有挑战性。首先,需要确认使用的图像或文本有没版权限制。为了避免版权问题,我们可以自己制作数据,也可以去Kaggle寻找数据集。有些dataset已经加了标注,有些则没有标注。
1.2 标注数据
我们可以用Label Studio来添加标注。支持3种形式安装:pip、Anaconda、docker。这里以pip安装为例:
# Requires Python >=3.7 <=3.9
pip install label-studio
# Start the server at http://localhost:8080
label-studio
2、简化模型
2.1 减少标签
选择2-5个类别给图像打标签,遵从简单原则。
2.2 剪裁边缘
样本图像尽可能保留完整轮廓。剩下一部分样本进行裁剪,这样