详细操作,见dlib 官网提供示例.
std::vector<matrix<rgb_pixel>> faces;
for (auto face : detector(img))
{
auto shape = sp(img, face);
matrix<rgb_pixel> face_chip;
extract_image_chip(img, get_face_chip_details(shape,150,0.25), face_chip);
faces.push_back(move(face_chip));
// Also put some boxes on the faces so we can see that the detector is finding
// them.
win.add_overlay(face);
}
if (faces.size() == 0)
{
cout << "No faces found in image!" << endl;
return 1;
}
在这 提供 dlib 示例地址。想必大家都可以找到...
在人脸对齐后,我们将图像 送往 网络..
std::vector<matrix<float,0,1>> face_descriptors = net(faces);
接下来 ,来解释参数:
1. net ( 这就是 定义的 网络结构),至于怎么定义的。这就不贴了。
2. face_descriptos[0] 这个其实就是 128D 的向量 [0,1]
3.注意 get_face_chip_details() 里面,后面 的两个参数...
4.有点疑问就是 ,在 对齐的 函数那里, 图像用的是array2d 结构, 而这里 是 matrix ,
不过没有 关系,可以转换。 <--- mat (arrary2d) 就可以了..
要知道,得到 128D 的向量值,在 硬件Rk 3368 上,花了 将近 6 s .. 我的天,, 无法想象...
后面要 优化?? 不会来真的吧?? 那就让 她来吧...
后面 来点 真的:
if (length(face_descriptors[i]-face_descriptors[j]) < 0.6)
在这里判断 小于 0.6 ,(这是什么意思??欧式距离 ? 能不能理解 这个0.6 ? 越相似,这个值越小 )
写到这里,越来越无感了,还要继续嘛。come on...
后期建议:
1.为什么 在 人脸的时候,没有 名字输入??(可以这么理解吧。我们输入一张图,在图中 搜索到 一张人脸, 要是没搜索到人脸 还好,要是有人脸的话,我要注册, 注册的名字,是不是 要上层 给,也就是传进来 我 来 处理?? 或许 我 ....)
2. 为什么 要 把 所有 人脸框 ,( 一张图中 all face_rect , 来存入一个 数据结构)。
这样 只对 判断(一张图) 有 几个人 有 便利。其他 ??
暂时 还没 想到 ....
3 . 还是 关于 人脸 与 名字的 关联 问题, 人脸的 存取。 后期 再 考虑。。
我 想 dlib 后期如果 更新的话。应该这些。我 刚刚 提到的。这些...
还有 速度 当然会 更快...模型,内存会更少... 这是 趋势...
---->
好了,今天的 更新 就到这里了,有机会下次 在见~~