主要介绍利用insightface来finetune自己的数据集
代码地址:https://github.com/deepinsight/insightface
代码目录结构如下图,src是旧的代码,其它文件夹是各个子模型的代码,本文主要用src目录下的代码(因为recognition下的代码在训练几个epoch后会出现准确率突降的现象,不知道什么原因)。
1. 自己数据集
文件组织格式:
- face下面分train和test两个文件夹,每个文件下n个子文件夹
- 每个子文件夹是一个人,里面有2张以上照片,MT-CNN对齐后的,大小112 * 112 * 3
2.生成lst文件
python face2lst_dp.py /path/to/data
参数:
data_dir
–ext 图片扩展名
–test-ratio 指定训练集和测试集比例
输出三个文件:
train1.lst,不输出,如果test-ratio=1
property,不输出,如果test-ratio=1
test.lst,不输出,如果test-ratio=0
默认放在face文件夹上的父目录
lst文件每行三个字段
0/1 :表示是否对齐,1对齐
file path:图片路径
class id:类别id,对应训练集里面的每个文件夹一个id,1,2,3…,n
3.生成rec和idx训练文件
python face2rec2.py /path/to/lst folder
参数:
prefix: 必需,lst文件所在文件夹
其它参数(略)
输出:
train.idx
train.rec
4.制作验证集bin文件
python face2rec2.py /path/to/test/data/folder
参数:
data_dir: 必需,test数据文件夹
–out_file:
–fold
–max_pairs: 最多分别生成多少对正负样本,也就是最终的最大输出是*2
输出:
custom_test.bin
5.下载模型
官方预训练好的模型的地址:https://github.com/deepinsight/insightface/wiki/Model-Zoo
我下的 3.1 LResNet100E-IR,ArcFace@ms1m-refine-v2
下载地址:https://pan.baidu.com/s/1wuRTf2YIsKt76TxFufsRNA
模型放在:insightface/models/
6.fine-tune
python -u train.py
修改parse_args方法里的参数:
–data-dir 指向第3步train.idx train.rec所在的目录
–prefix 模型输出路径,即训练过程的模型保存目录
–pretrained 预加载模型路径,例如:…/models/model-r100-ii/model,0
–ckpt 设置是否保存训练模型
–network 指定主干网络,r100表示resnet100
–lr 学习率
–margin-m
–margin-s
–margin-a
–margin-b
上面四个分别对应损失函数的:s * cos(m * theta+a)+b
–loss-type 指定损失函数类型,4表示arcface
–target 表示验证集,例如’lfw’,在–data-dir 目录下就需要有lfw.bin验证集文件