实验09 判别分析
一、实验目的
完成第九份作业,趁热打铁学会聚类分析的兄弟——判别分析
二、实验内容
距离判别分析
贝叶斯判别分析
三、实验数据准备
课后作业、某个盐泉分类
四、实验过程
(一)SAS程序
①贝叶斯判别
Data dd;
Input y $ x1 x2 x3 x4;
Cards;
cancer 228 134 20 11
cancer 245 134 10 40
cancer 170 150 7 8
cancer 100 167 20 14
gastritis 225 125 7 14
gastritis 130 100 6 12
gastritis 150 117 7 19
gastritis 120 133 10 26
gastritis 160 100 5 6
healthy 185 115 5 6
healthy 170 125 6 4
healthy 135 108 2 12
healthy 100 117 7 2
;
Data td;
Input x1 x2 x3 x4;
Cards;
165 142 5 3
200 167 12 27
;
Proc Discrim data=dd testdata=td list testlist;
Class y;
Var x1 x2 x3 x4;
Priors 'cancer'=0.33333 'gastritis'=0.33333 'healthy'=0.33333;
Run;
②距离判别
Data T;
Input T $ X1 X2 X3 X4;
Cards;
A 13.85 2.79 7.80 49.60
A 22.31 4.67 12.31 47.80
A 28.82 4.63 16.18 62.15
A 15.29 3.54 7.50 43.20
A 28.79 4.90 16.12 58.10
B 2.18 1.06 1.22 20.60
B 3.85 0.80 4.06 47.10
B 11.40 0.00 3.50 0.00
B 3.66 2.42 2.14 15.10
B 12.10 0.00 5.68 0.00
;
Data td;
Input P $ X1 X2 X3 X4;
Cards;
1 8.85 3.38 5.17 26.10
2 28.60 2.40 1.20 127.00
3 20.70 6.70 7.60 30.20
;
Proc Discrim data= T testdata=td pool=test list testlist;
Class T;
Var X1 X2 X3 X4;
(二)SAS运行结果
①贝叶斯判别
DISCRIM 过程
以下检验数据的分类汇总: WORK.TD
使用以下项的分类汇总: 二次判别函数
检验数据的观测概略 |
|
读取的观测数 |
2 |
使用的观测数 |
2 |
分入“disease”的观测数和百分比 |
||||||||||||
|
cancer |
gastriti |
healthy |
合计 |
||||||||
合计 |
|
|
|
|
||||||||
先验 |
|
|
|
|
DISCRIM 过程