【思考】人脸识别是什么玩意?我理解的人脸识别

有一个月没更新文章了,看到每天还有新朋友关注,觉得还是要多分享才好,今天来聊聊我理解的人脸识别!

   人脸识别,让计算机告诉我这个镜头前的人脸是谁?

人脸识别,通过摄像头捕捉到人脸,将人脸部分截取出,通过模型得到该人脸的特征向量,然后与已经标注好的人脸库做相似性计算,计算最相近的人脸标签则返回人脸标签。

人脸识别,先有一个人脸检测的步骤,如何从一个图中检测到人脸的存在,这样的模型已经非常成熟了,主要是通过人脸的特征点(如,左眼角,右眼角,鼻子,左嘴角,右嘴角)来进行训练的,前期需要人为的去做人脸框的标注,特征点的标注。通过神经网络不断去拟合参数,使模型能够找到人脸特征并取得合适的人脸框(范围)。

人脸一旦获得,需要去训练,要经过截取,在尺寸进行缩放到固定大小。

如今开源的世界有很多已经弄好的人脸识别的模型可以拿来直接用,当然自己训练也是可以的,之所以拿别人的模型来用,可能是你的训练数据还不够多,无法进行深度学习的训练,第二个自己的资源有限,无法做深层的神经网络进行训练,比较节省时间的做饭就拿已有开源模型做微调也叫finetuning。

在做人脸识别时,训练时做分类训练,分类之前会有一个全连接层表征人脸的特征,通常是4096维。这个特征每个人的都不同,类似于基因,DNA,不同人脸,也一定不同。

我们做微调就是继续在已经训练好的模型上继续用自己的数据进行训练,模型训练好就代表各网络层的参数是有它的一个不错的值在。

如果不做微调呢,可不可以直接用,当然也可以,只不过别人的模型不一定适合自己,为什么不一定适合,人脸数据来源不同,可能不同肤色的人脸,不同国籍的人脸模型都存在区别。

如何让自己的人脸模型适合自己的使用场景呢,那就是再用大量的数据进行补充,主要是需要产品特定情境下的数据。

然而,数据来源并不是那么好获得,有公开的数据源,但不一定合适或者还不够。怎么解决呢?购买,跟标注公司购买。当然价格一定不便宜,如果公司承担不起,那就再找办法。本人接触的办法是,公司考勤和门禁的数据为主线,网络爬去明星数据!如果公司门禁是通过刷卡进入,可以通过在刷卡时进行拍照,可以设置频率获取到一定的人脸数据,每个时间段人脸数据也一定不同,至少角度,表情也会不一样。

 

为什么要爬去明星的人脸数据呢,因为明星的人脸网络上多啊,爬下来几百张是很容易的。找到照片只是第一步,通过人脸检测获取照片中的人脸,此刻会有问题,人脸并不是只有一个人出现,还不一定是同一个人,此刻就需要我们去进行挑选了。如何在一个几百张人脸照片中挑出其他人并删除是一件辛苦的工作,胖子照片中找瘦子很容易,男人中删除女人头像也算容易,但一些大众脸混合在一起真有点困难。

找到了更多的数据,微调的过程还会有一些坑,如何保证样本的均衡性,如何确定合适的学习率等都需要不断来实验,实验的过程并不是马上就能看到结果的,因为图片的数据量一般偏大,哪怕只是在做微调也同样可能消耗一周的时间。等待过程是枯燥的,有希望的,甚至还有崩溃的不收敛,突然程序挂掉了等一些异常!

做人脸识别,并不是一件多么高大上的事情,但是要做好它也不是很容易,寻找合适模型,找到合适参数,需要调参运动员不懈的努力。

这是鄙人的一点拙见和心得,希望对你有些帮助!

 

阅读推荐

下载|730页 凸优化英文原版

下载|382页 PYTHON自然语言处理

下载|498页 Python基础教程第3版

下载|1001页 Python数据分析与数据化运营

下载|439页 统计学习基础-数据挖掘、推理预测

下载|271页 漫画线性代数

下载|322页 Machine Learning for Hackers

下载|215页 推荐系统实践

BAT算法工程师(机器学习)面试100题(上)

GBDT+LR算法解析及Python实现

下载|Python刷题,你要的LeetCode答案都在这里了!

下载|吴恩达deeplearning.ai深度学习教学视频

10分钟入门TensorFlow

10分钟入门TensorFlow(2): 房价预测(Python代码篇)

比Adam,SGD更优秀的AdaBound实验对比代码

GBDT+LR算法解析及Python实现

下载|经典《深度学习-花书》《机器学习-周志华》《统计学习方法-李航》《机器学习实战》《利用Python进行数据分析》

CNN网络架构演进:从LeNet到DenseNet

比Adam,SGD更优秀的AdaBound实验对比代码

10分钟入门Keras : 两种快速模型搭建方式

2019年两会,关于AI的提案|汇总

6种机器学习中的优化算法:SGD,牛顿法,SGD-M,AdaGrad,AdaDelta,Adam

视频下载|Spark ML机器学习实战 全套

下载|182页 SQL tutorial

下载视频|人工智能推荐系统课程

用20行Python代码为《都挺好》剧照进行人脸检测

FaceNet 人脸识别模型- 彭于晏和邓超人脸像吗

中文课程!台大李宏毅机器学习公开课2019版上线

收藏:全网最大机器学习数据集,视觉、NLP、音频都在这了

XGBoost高准确率的背后知识

Pandas入门(1):Pandas是什么?

推荐系统论文下载和工业界方法文章推荐

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值