最近开始了模式识别的学习,对模式和模式类的概念有一个基本的了解,并使用MATLAB实现一些模式类的生成。而接下来如何对这些模式进行分类成为了学习的第二个重点。我们都知道,一个典型的模式识别系统是由特征提取和模式分类两个阶段组成的,而其中模式分类器(Classifier)的性能直接影响整个识别系统的性能。 因此有必要探讨一下如何评价分类器的性能,这是一个长期探索的过程。
一、敏感性和特异性
以下例子假定x是一个连续随机变量,对于类别状态 和 的x的概率密度函数如图所示:
这里假设先验概率已知,对于一个二分类问题,可以定义以下四个统计值:
可以将实例分成正类(Positive)或负类(Negative)。这样会出现四种分类结果:
TP(True Positive):正确的正例,一个实例是正类并且也被判定成正类;