问题描述
在做人脸识别的时候,前期的数据处理过程中可能会遇到一个问题,即将人脸从不同尺寸的图像中截取出来,再进行“对齐”操作。这样可以使每一个截取的人脸中的眼睛等位置处于同一位置,会对后面的识别算法起到一定的优化作用。
比如,下面 3 张图片所示,人脸的位置,图像的大小各不一样。我们所需要做的就是,将人脸从各个图片中截取出来,再旋转进行校正,使得眼睛在同一位置上,最后将图片的大小也统一调整为 224 x 224。
校正的效果如下图所示:
实现步骤
前提:已经提取出每张图片里眼睛的坐标,只需要读取数据就行
整个过程遵循以下几个步骤:
找两眼间的直线距离并计算该直线与水平线之间的夹角,即倾斜角度
根据找到的倾斜角度旋转图片
在旋转后的图片中找到眼睛的位置
根据眼睛坐标找到包含面部的框的宽度和高度
调整图片的尺寸
1. 计算直线距离及倾斜角度
计算两眼之间的距离很简单,只要找出两个向量的坐标就可以计算出来。计算两眼之间的距离直线的倾斜角度,就是将两个向量相减,得到一组横纵坐标,然后利用 arctan 的公式求解角度,公式如下所示:
大多数 sin / cos 等函数要求角度为弧度,可以使用这个转换公式:angle = angle * 180 / π