判别分析-基于matlab

原理介绍
  • 在生产、科学研究和日常生活中,经常会遇到对某一研究对象属于哪种情况作出判断。
  • 实际案例:
    (1)要根据这两天天气情况判断明天是否会下雨;
    (2)医生要根据病人的体温、白血球数目及其它症状判断此病人是否会患某种疾病;
    (3)根据之前关于破产企业与财务良好的企业的数据,来判断新的企业是否破产;
    从概率论的角度看,可把判别问题归结为如下模型。设共有 n个总体:
    × 1 × 2 , … × n \times 1 \times 2, \ldots \times n ×1×2,×n
    其中 Xi 是m 维随机变量,其分布函数为
    F i ( x 1 , … , x m ) , i = 1 , 2 , … , n F_{i}\left(x_{1}, \ldots, x_{m}\right), i=1,2, \ldots, n Fi(x1,,xm),i=1,2,,n
    (x1,…,xm) 是表征总体特性的m 个随机变量的取值。在判别分析中称这m 个变量
    为判别因子。现有一个新的样本点X=(x1,…,xm)’,要判断此样本点属于哪一个总体。
Matlab 判别函数classify。
  • 函数的调用格式为:
    [CLASS,ERR] = CLASSIFY(SAMPLE,TRAINING,GROUP, TYPE)
name说明
SAMPLE未知待分类的样本矩阵
TRAINING已知分类的样本矩阵,
GROUPt维列向量
TYPE分类方法

SAMPLE 为未知待分类的样本矩阵;TRAINING 为已知分类的样本矩阵,它们有相同的列数m ,设待分类的样本点的个数,即SAMPLE 的行数为s ,已知样本点的个数,即TRAINING 的行数为t ,则GROUP 为t 维列向量,若TRAINING 的第i 行属于总体Xi,则GROUP 对应位置的元素可以记为i,TYPE 为分类方法,缺省值为’linear’,即线性分类,TYPE 还可取值’quadratic’,‘mahalanobis’(mahalanobis 距离)。返回值CLASS 为s 维列向量,给出了SAMPLE 中样本的分类,ERR 给出了分类误判率的估计值。

matlab实例
  • 例1 已知 8 个乳房肿瘤病灶组织的样本,其中前3 个为良性肿瘤,后5 个为恶性
    肿瘤。数据为细胞核显微图像的10 个量化特征:细胞核直径,质地,周长,面积,光滑度。根据已知样本对未知的三个样本进行分类。已知样本的数据为:

    细胞核直径质地周长面积光滑度
    13.5414.3687.46566.30.09779
    3.0815.7185.635200.1075
    .50412.4460.34273.90.1024
    7.9910.38122.810010.1184
    0.5717.77132.913260.08474
    9.6921.2513012030.1096
    1.4220.3877.58386.10.1425
    0.2914.34135.112970.1003

    待分类的数据为:

    细胞核直径质地周长面积光滑度
    6.628.08108.3858.10.08455
    0.629.33140.112650.1178
    .7624.5447.92110.05263
  • matlab代码:

    A=[13.54,14.36,87.46,566.3,0.09779;
    13.08,15.71,85.63,520,0.1075
    9.504,12.44,60.34,273.9,0.1024;
    17.99,10.38,122.8,1001,0.1184;
    20.57,17.77,132.9,1326,0.08474;
    19.69,21.25,130,1203,0.1096;
    11.42,20.38,77.58,386.1,0.1425;
    20.29,14.34,135.1,1297,0.1003]  %原始数据,不包含分类指标g
    
    x=[16.6,28.08,108.3,858.1,0.08455;
    20.6,29.33,140.1,1265,0.1178;
    7.76,24.54,47.92,181,0.05263]  %需要分类的数据集,A和X的列数保持一致
    
    g=[ones(3,1);2*ones(5,1)]; %原始数据分类的情况,1为良性肿瘤标准,2个为恶性肿瘤标准
    %调用函数
    [class,err]=classify(x,a,g)  %可以选择TYPE类型,缺省值为'linear',即线性分类,TYPE 还可取值'quadratic'(二次判别)'mahalanobis'(mahalanobis 距离)
    
  • 4
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值