SIMCA分类法中主成分分析算法探究
SIMCA分类法中主成分分析算法探究 摘要:模式识别是研究用计算机模拟人的识别能力,对不同类型形式的数据进行描述、分类、识别等有关的理论和方法。SIMCA方法是基于主成分分析之上的一种模式识别方法,本文对SIMCA分类法中主成分分析的算法进行了比较研究,并在MATLAB中进行了模拟和结果比较
关键词:模式识别;SIMCA分类法;主成分分析
中图分类号:R965; O6204 文献标识码:A 文章编号:1007-9416(2017)04-0145-02
1 基于主成分分析的SIMCA分类法[1]
SIMCA(Soft Independent Modeling Class Analog)是由瑞典化学家Wold于1976年提出的一种基于主成分分析(PCA,Principal component analysis)的分类方法。它利用先验分类知识,对每一种类别建立一个PCA模型,然后利用这些建立的模型判断未知样本的归属。SIMCA方法是通过F检验设定分类的置信区间,针对每个类,其F检验的两个维度的自由度分别为:(M-A)和(n-A-1)(M-A),其中M为变量数(变量数对每类应该是一样的),A为该类的有效主成分数,n为该类的样本数。对化学测量来说,一般样本数n都远远小于测量变量数M,为使每个维度的自由度大于0,请注意样本数、变量数和选择的主成分数之间的关系
1.1 原理
SIMCA方法是一种建立在主成分分析基?A上的模式识别方法,其基本思路是先利用PCA分析建立每个类别的模型,然后计算未知样本与PCA模型的距离,根据距离判别方法判别分析,以确定其属于哪一类或不属于哪一类<