在生产、科学研究和日常生活中,经常会遇到对某一研究对象属于哪种情况作出
判断。例如要根据这两天天气情况判断明天是否会下雨;医生要根据病人的体温、白血
球数目及其它症状判断此病人是否会患某种疾病等等。
从概率论的角度看,可把判别问题归结为如下模型。设共有 n个总体:
ξ ,ξ , ,ξ n 1 2 L
其中 i
ξ
是m 维随机变量,其分布函数为
( , , ) i 1 m F x L x ,i = 1,2,L,n
而( , , ) 1 m x L x 是表征总体特性的m 个随机变量的取值。在判别分析中称这m 个变量
为判别因子。现有一个新的样本点T
m x (x , , x ) = 1 L ,要判断此样本点属于哪一个总
体。
Matlab 的统计工具箱提供了判别函数classify。
函数的调用格式为:
[CLASS,ERR] = CLASSIFY(SAMPLE,TRAINING,GROUP, TYPE)
其中SAMPLE 为未知待分类的样本矩阵,TRAINING 为已知分类的样本矩阵,它们有
相同的列数m ,设待分类的样本点的个数,即SAMPLE 的行数为s ,已知样本点的个
数,即TRAINING 的行数为t ,则GROUP 为t 维列向量,若TRAINING 的第i 行属于
总体i
ξ
,则
GROUP 对应位置的元素可以记为i,TYPE 为分类方法,缺省值为'linear',即线性分类&