计算机图形学零碎学习

最新推荐文章于 2024-08-07 21:51:21 发布

五月的天气

最新推荐文章于 2024-08-07 21:51:21 发布

阅读量291

点赞数

分类专栏： 3d重建

本文链接：https://blog.csdn.net/qq_37414405/article/details/119029706

版权

3d重建专栏收录该内容

21 篇文章 25 订阅

订阅专栏

MTCNN：Multi-task convolutional neural network（多任务卷积神经网络）
将人脸区域检测与人脸关键点检测放在了一起，它的主题框架类似于cascade。总体可分为P-Net、R-Net、和O-Net三层网络结构。

转载至https://blog.csdn.net/qq_36782182/article/details/83624357

它是2016年中国科学院深圳研究院提出的用于人脸检测任务的多任务神经网络模型，该模型主要采用了三个级联的网络，采用候选框加分类器的思想，进行快速高效的人脸检测。
这三个级联的网络分别是快速生成候选窗口的P-Net、进行高精度候选窗口过滤选择的R-Net和生成最终边界框与人脸关键点的O-Net。和很多处理图像问题的卷积神经网络模型，该模型也用到了图像金字塔、边框回归、非最大值抑制等技术。
使用这里给出的示例，获得图片的五个特征点

>>> from mtcnn import MTCNN
>>> import cv2
>>>
>>> img = cv2.cvtColor(cv2.imread("ivan.jpg"), cv2.COLOR_BGR2RGB)
>>> detector = MTCNN()
>>> detector.detect_faces(img)
[
    {
        'box': [277, 90, 48, 63],
        'keypoints':
        {
            'nose': (303, 131),
            'mouth_right': (313, 141),
            'right_eye': (314, 114),
            'left_eye': (291, 117),
            'mouth_left': (296, 143)
        },
        'confidence': 0.99851983785629272
    }
]

通过最小二乘法来求投影矩阵https://blog.csdn.net/qq_41813454/article/details/105364003
有了投影矩阵从而可以把世界坐标系变化到图像坐标系。