OpenCV人脸识别FisherFaces 算法：从原理到代码

最新推荐文章于 2025-05-16 10:52:24 发布

多巴胺与内啡肽.

最新推荐文章于 2025-05-16 10:52:24 发布

阅读量571

点赞数 24

分类专栏： OPENCV 文章标签： opencv 算法人工智能

本文链接：https://blog.csdn.net/m0_65065095/article/details/147992286

版权

OPENCV 专栏收录该内容

26 篇文章

订阅专栏

前言

在人脸识别领域，FisherFaces 算法凭借有监督学习的优势，成为经典的判别式方法之一。

一、FisherFaces 算法核心原理

1. 算法思想：最大化类间差异，最小化类内差异

FisherFaces 基于线性判别分析（LDA），与 EigenFaces（PCA）的无监督降维不同，它是有监督学习方法，目标是找到一个投影方向。PCA方法是EigenFaces人脸识别的核心，但是其具有明显的缺点，在操作过程中会损失许多人脸的特征信息。因此在某些特殊的情况下，如果损失的信息刚好是用于分类的关键信息，必然导致结果预测错误。

Fisherfaces采用LDA（Linear Discriminant Analysis，线性判别分析）实现人脸识别。
其基本原理：在低维表示下，首先将训练集样本集投影到一条直线A上，让投影后的点满足：

同类间的点尽可能地靠近，
异类间的点尽可能地远离。

2. 数学推导

数据准备：假设训练集有(C)个类别（人脸身份），每个类别有 (n_i)张图像，总样本数(N=\sum n_i)
计算类内散度矩阵
（(S_W)）：(S_W = \sum_{c=1}^C \sum_{x \in X_c} (x - \mu_c)(x - \mu_c)^T)（(\mu_c)为第(c)类的均值向量）
计算类间散度矩阵
（(S_B)）：(S_B = \sum_{c=1}^C n_c (\mu_c - \mu)(\mu_c - \mu)^T)（(\mu)为所有样本的全局均值）
广义特征值分解：
求解广义特征值问题 (S_B w = \lambda S_W w)，提取前(d)个最大特征值对应的特征向量，构成投影矩阵(W)。

3. 与 EigenFaces 的核心区别

在这里插入图片描述

二、Python 实战

1. 环境准备

pip install opencv-python numpy matplotlib

依赖库：OpenCV（算法实现）、NumPy（数值计算）、Matplotlib（可视化）

2. 数据集准备

使用经典的ORL 人脸数据集（40 人，每人 10 张图像，尺寸 112×92），需提前解压到项目目录的ORL_faces文件夹。

3. 代码实现与分步解析

数据加载与预处理

import cv2
import numpy as np
import os
from matplotlib import pyplot as plt

4. 加载数据集（含标签）

def load_dataset(path):
    faces = []  # 存储人脸图像向量（一维）
    labels = []  # 存储标签（0~39对应40个人）
    label = 0    # 标签计数器

    # 遍历文件夹（每个子文件夹对应一个人）
    for root, dirs, files in os.walk(path):
        for file in files:
            img_path = os.path.join(root, file)
            # 灰度图读取并转为一维向量（112*92=10304维）
            img = cv2.imread(img_path, cv2.IMREAD_GRAYSCALE)
            faces.append(img.flatten())
            labels.append(label)
        label += 1  # 切换到下一个人的标签
    return np.array(faces), np.array(labels)

关键点：图像需统一尺寸并灰度化，转换为一维向量以便矩阵运算
标签逻辑：每个子文件夹对应一个唯一标签（0 开始递增）

5.训练FisherFaces模型

def train_fisherfaces_model(faces, labels, num_components=39):  # 最大维度为C-1=39
    model = cv2.face.FisherFaceRecognizer_create(
        num_components=num_components,  # 保留的特征数量（不超过C-1）
        threshold=0.0  # 识别阈值（置信度低于该值则认为“未识别”）
    )
    model.train(faces, labels)  # 输入训练数据（样本矩阵，标签数组）
    return model

6.主程序：加载数据并训练

data_path = 'ORL_faces'
faces, labels = load_dataset(data_path)
fisherfaces_model = train_fisherfaces_model(faces, labels)

API 说明：cv2.face.FisherFaceRecognizer_create提供参数控制降维维度和识别阈值
维度限制：由于 LDA 最大维度为类别数 - 1（40 人对应 39 维），num_components最大设为 39

7. 预测函数（返回标签和置信度）

def predict_face(model, test_face):
    # 注意：输入需是二维矩阵（n_samples, n_features）
    test_face_2d = test_face.reshape(1, -1)
    predicted_label, confidence = model.predict(test_face_2d)
    return predicted_label, confidence

8.选取第50张图像（属于第5个人，标签4）

test_index = 50
test_face = faces[test_index]
pred_label, conf = predict_face(fisherfaces_model, test_face)

print(f"预测标签：{pred_label}，真实标签：{labels[test_index]}")
print(f"置信度（值越小越可靠）：{conf:.2f}")

置信度含义：FisherFaces 的置信度是预测时的距离度量值，值越小表示匹配越准确
维度转换：输入模型的测试数据必须是二维矩阵（即使单样本也需 reshape 为 (1, n_features)）

9.可视化平均脸和特征脸

def visualize_features(model, face_size=(112, 92)):
    mean_face = model.getMean().reshape(face_size)  # 全局平均脸
    eigenvectors = model.getEigenVectors()  # 获取投影矩阵（特征向量）

    plt.figure(figsize=(12, 6))
    
    # 显示平均脸
    plt.subplot(2, 5, 1)
    plt.imshow(mean_face, cmap='gray')
    plt.title("平均脸")
    
    # 显示前9个特征脸
    for i in range(9):
        eigenface = eigenvectors[i].reshape(face_size)
        plt.subplot(2, 5, i+2)
        plt.imshow(eigenface, cmap='gray')
        plt.title(f"特征脸{i+1}")
    
    plt.show()

visualize_features(fisherfaces_model)