模式识别的大致流程如下:
从图中我们可以知道,特征提取与选择是在分类器设计之前完成,它主要的工作是针对数据原始特征的缺陷,降低特征维数,提高分类器的设计与性能。
原始特征
模式识别中把每个对象都量化为一组特征来描述,构建特征空间是解决模式识别问题的第一步,其中通过直接测量得到的特征称为原始特征。如:
- 人体的各种生理指标(以描述健康状况)
- 数字图像中的每点的灰度值(以描述图像内容)
原始特征的形成一般包含三大类:物理、结构和数学特征
+ 物理和结构特征:易于为人的直觉感知,但是有时难以定量描述,因此不利于机器判别;
+ 数学特征:易于用机器判别和分析,如统计特征。
原始特征是我们直接测量获得的,但是往往不用于模式识别中,主要有以下几个原因:
1. 原始特征不能反映对象的本质特征;
2. 高维的原始特征不利于分类器的设计;
+ 计算量大,如对于一幅1024*768的灰度图像,灰度级为256级,直接表示需要786432 bytes,进行训练识别所需的空间、时间和计算量都无法接受;
&#