一):人脸数据库
AR人脸库(包含50位男性和50位女性每人26张人脸共2600张人脸图片 ):
http://www.datatang.com/data/46195
ORL人脸库(包含40个人的每人10张人脸的共400张人脸):
http://www.cl.cam.ac.uk/Research/DTG/attarchive:pub/data/att_faces.tar.Z
或者
http://www.cl.cam.ac.uk/Research/DTG/attarchive:pub/data/att_faces.zip
二):PCA实验
人脸数据库有很多,这里先暂时选取了上面两种来实验。主成分分析PCA算法在前面介绍过,这里主要接上节:
主成分分析-简单人脸识别(二)这篇里面使用的人脸单一,数据量少,识别率无法观察。这里有了数据库在重新评估下PCA算法的准确率。程序上面略有改动。
2.1)数据库的导入
对上述下载下来的数据库,由于量太大了,没法去一一改文件夹呀整理人脸照片等等,那么如何快速导入并直接使用下载下来的文件夹呢?下载后可以发现AR数据库没有子文件夹,而ORL数据库有二级子文件夹。首先把对应的文件夹复制到matlab程序所在的当前文件夹中,然后编写matlab直接读取文件夹信息:
读取AR文件夹:
function filedata = File_Read_AR()
% 用法: filedata = File_Read_AR();
% 样本数:man:50个,每个样本还有26个子样本,每个子样本大小:165*120
% woman:50个,每个样本还有26个子样本,每个子样本大小:165*120
% 载入文件夹
pathname = uigetdir(cd, 'C:\Users\Administrator\Documents\MATLAB\人脸识别\PCA+SVM');
filesjpg = ls(strcat(pathname,'/*.pgm'));
files = [cellstr(filesjpg)]; % 得到文件路径
for i = 1:100 %选取前50/100个人的各26张照片(50*26)
for j = 1:26
Filesname = strcat(pathname,'/',files((i-1)*26+j));
filedata{i,j} = imread(cell2mat(Filesname));
end
end
读取ORL文件夹:
function filedata = File_Read_ORL()
% 用法: filedata = File_Read();
% 样本数:40个人,每个样本还有10个子样本,每个子样本大小:119*92
% clc; clear all;
% 载入文件夹
for i = 1:40
pathname = uigetdir(cd, 'C:\Users\Administrator\Documents\MATLAB\人脸识别\PCA+SVM');
filesjpg = ls(strcat(pathname,'/*.pgm'));
files = [cellstr(filesjpg)]; % 得到文件路径
len = length(files); % 文件个数
for j = 1:len
Filesname = strcat(pathname,'/',files(j));
filedata{i,j} = imread(cell2mat(Filesname));
end
end
这里程序运行时需要选择文件夹,AR只需要选择一次,ORL需要选择40次。
为了避免每次程序实验程序的时候去反复的选择文件夹,在一次运行后保存下来得到filedata文件。如:save face_orl.mat;
保存为.mat格式后,以后每次运行的时候只需要点一下就可以导入数据库了。
2.2)将样本分类
有了总样本数据库,现在就是把样本分为训练集于测试集了。定义一个num数表示训练集中的对于每个人,随机选其中的num张脸当成样本,其他的(all-num)当成测试集,最后在转化为PCA可以使用的格式。
function [train_face,test_face] = imgdata(filedata,num)
%% 每个人取num个样本脸
k = 2; %k=1,选用 ORL人脸库 否则选用 AR人脸库
if k == 1
%用法:适用于 ORL人脸库
[m,n] = size(filedata{1,1}); %取图片大小
for i = 1:40 %共有40个人
n_rand = randperm(10);
for j = 1:num
train_pic{(i-1)*num+j} = filedata{i,n_rand(j)};%j
end
for k = 1:(10-num)
test_pic{(i-1)*(10-num)+k} = filedata{i,n_rand(k+num)};%k+num
end
end
for i = 1:40*num
train_face(i,:) = reshape(train_pic{i},1,m*n);
end
for i = 1:40*(10-num)
test_face(i,:) = reshape(test_pic{i},1,m*n);
end
%%
else
%用法:适用于 AR人脸库
[m,n] = size(filedata{1,1}); %取图片大小
num_people = size(filedata,1); %使用了num_people个人的各26张脸
for i = 1:num_people %共有num_people个人
n_rand = randperm(26);
for j = 1:num
train_pic{(i-1)*num+j} = filedata{i,n_rand(j)};%
end
for k = 1:(26-num)
test_pic{(i-1)*(26-num)+k} = filedata{i,n_rand(k+num)};
end
end
for i = 1:num_people*num
train_face(i,:) = reshape(train_pic{i},1,m*n);
end
for i = 1:num_people*(26-num)
test_face(i,:) = reshape(test_pic{i},1,m*n);
end
end
2.3)PCA进行降维