工业级的人脸识别算法已经流水线化,一般而言,流程如下:
1. 采集海量的人脸图像,例如WebFace数据集(包含10,575人,近50万张图像),训练初始的general人脸识别模型。可以完全随机初始化,也可以从imagenet上fine-tune, 以WebFace数据集为训练集,在LFW上测试,在imagenet上finetune的模型在实际中可观测到0.5%的性能提升。严格说,这并不具备统计上的显著性,但是可以认为imagenet的fine-tune是无害的。
2. Fine-tune的策略设计
我的师兄,李绍欣博士在博士论文中给了这样一张图:
最外端是随机图像,然后是自然图像,最后是人脸图像(WebFace->MultiPIE), 模型的训练过程可以理解为从随机图像(随机初始化)到ImageNet模型,再到一个分布更为general的人脸数据集(WebFace),最后到一个领域特定的人脸数据集。
1. 采集海量的人脸图像,例如WebFace数据集(包含10,575人,近50万张图像),训练初始的general人脸识别模型。可以完全随机初始化,也可以从imagenet上fine-tune, 以WebFace数据集为训练集,在LFW上测试,在imagenet上finetune的模型在实际中可观测到0.5%的性能提升。严格说,这并不具备统计上的显著性,但是可以认为imagenet的fine-tune是无害的。
2. Fine-tune的策略设计
我的师兄,李绍欣博士在博士论文中给了这样一张图:
最外端是随机图像,然后是自然图像,最后是人脸图像(WebFace->MultiPIE), 模型的训练过程可以理解为从随机图像(随机初始化)到ImageNet模型,再到一个分布更为general的人脸数据集(WebFace),最后到一个领域特定的人脸数据集。
在实践中,我一般建议有一个足够general的人脸模型,然后在领域特定的数据集上做finetune.
参见网站:http://www.thinkface.cn/thread-4158-1-1.html