【应用多元统计分析】CH5 判别分析1,2——引言,距离判别

本文详细介绍了判别分析的目标,包括分类和分离,并通过多个实例展示了判别分析在不同领域的应用,如保险、医疗、植物分类等。重点讨论了两组和多组距离判别,阐述了判别规则、误判概率及其估计方法,如回代法、划分样本和交叉验证法。此外,探讨了如何判断判别分类的有效性和选择线性或二次判别函数的策略。
摘要由CSDN通过智能技术生成

目录

引言

1.判别分析的目标

(1)目标1(预测方面):分类(或分配)

(2)目标2(描述方面):分离

2.判别分析的例子

(1)有偿付能力与无偿付能力的财产责任保险公司

(2)非胃溃疡病组(胃功能紊乱者)与控制组(“正常”者)

(3)两种野草

(4)新产品的速购者与迟购者

(5)良好信用与不良信用风险

3.本章讨论的判别分析

距离判别

前言

引例

一、两组距离判别

1.​编辑时的判别

(1)判别规则

(2)误判概率

(3)组之间是否已过于接近的界定

(4)【例题5.2.1】

(5)抽取样本估计有关未知参数

(6)误判概率的非参数估计

1)回代法

 2)划分样本

3)交叉验证发(刀切法)

2.​编辑时的判别

(1)判别规则

(2)【例5.2.2】 

二、多组距离判别

1.判别规则

2.抽取样本估计有关未知参数

(1)​情形

(2) ​不全相等的情形

3.判别分类是否有效

4.采用线性还是二次判别函数的策略

5.【例5.2.3】


 

引言

1.判别分析的目标

(1)目标1(预测方面):分类(或分配)

        在已知历史上用某些方法已把研究对象分成若干组(亦称类或总体)的情况下,来判定新的观测样品应属的组别。

(2)目标2(描述方面):分离

        就是用图形(通常二维,有时三维或一维,一般通过降维实现)方法或代数方法描述来自各组的样品之间的差异性,最大限度地分离各组。

2.判别分析的例子

(1)有偿付能力与无偿付能力的财产责任保险公司

测量变量:总资产,股票与债券价值,股票与债券的市值,损失支出,盈余,签订的保费金额

(2)非胃溃疡病组(胃功能紊乱者)与控制组(“正常”者)

测量变量:焦虑,依赖感,罪恶感,完美主义的量度

(3)两种野草

测量变量:萼片与花瓣的长度,花瓣裂缝的深度,苞的长度,花粉直径

(4)新产品的速购者与迟购者

测量变量:教育,收入,家庭大小,过去更换品牌的次数

(5)良好信用与不良信用风险

测量变量:收入,年龄,信用卡数目,家庭规模

3.本章讨论的判别分析

  • 每一组中所有样品的p维指标值x=(x_{1},x_{2},\cdots,x_{p})^{'}构成了该组的一个p元总体分布
  • 我们对新样品x进行的判别归类将在很大程度上依赖于各组的总体分布或其分布特征
  • 距离判别和贝叶斯判别只能用于分类
  • 费希尔判别既可用于分类,也可用于分离,且更多地用于后者
  • 这些都是基于判别变量为定量变量的

距离判别

前言

        距离判别的基本思想是:样品和哪个总体距离最近,就判它属哪个总体。距离判别也成为直观判别法。

引例

        直观地看,X_{0}与设备A的绝对距离近些,按距离最近的原则是否应把产品X_{0}判断为设备A生产的?

        考虑一种相对于分散性的距离:记X_{0}与A,B的相对平方距离为

\left\{\begin{matrix} d_{1}^2(x_{0})=\frac{(x_{0}-\mu_{1})^2}{\sigma^{2}(1)}=\frac{(78-80)^2}{0.25}=16\\ d_{2}^2(x_{0})=\frac{(x_{0}-\mu_{2})^2}{\sigma^{2}(2)}=\frac{(78-75)^2}{4}=2.25 \end{matrix}\right.

 因为d_{2}(x_{0})=1.5<4=d_{1}(x_{0}),按这种距离准则应判X_{0}为设备B产生的。

         设备B生产的产品质量较分散,出现X_{0}为78的可能性仍较大;而设备A生\Sigma _{1}=\Sigma _{2}=\Sigma产的产品产品质量较集中,出现X_{0}为78的可能性较小。因此,判X_{0}为设备B的产品更合理。

        这种相对于分散性的距离就是马氏距离。

一、两组距离判别

        设组\pi_{1},\pi_{2}的均值分别为\mu_{1},\mu_{2},协差阵分别为\Sigma _{1},\Sigma _{2}(\Sigma _{1},\Sigma _{2}>0),x是一个新样品(p维),现欲判断它来自哪一组。

1.\Sigma _{1}=\Sigma _{2}=\Sigma时的判别

(1)判别规则

\left\{\begin{matrix} d_{1}(x,\pi_{1})=(x-\mu_{1})^{'}\Sigma _{1}^{'}(x-\mu_{1})\\ d_{2}(x,\pi_{2})=(x-\mu_{2})^{'}\Sigma _{2}^{'}(x-\mu_{2}) \end{matrix}\right.

\left\{\begin{matrix} x\epsilon \pi_{1},d^2(x,\pi_{1})\leqslant d^2(x,\pi_{2})\\ x\epsilon \pi_{2},d^2(x,\pi_{1})> d^2(x,\pi_{2})\ \end{matrix}\right.

         其中,\bar{\mu}=\frac{1}{2}(\mu_{1}+\mu_{2}),a=\Sigma^{-1}(\mu_{1}-\mu_{2})。令{\color{Red} W(x)=a^{'}(x-\bar{\mu})},则上述判别规则可化简为:

{\color{Red} \left\{\begin{matrix} x\epsilon \pi_{1},W(x)\geqslant 0\\ x\epsilon \pi_{2},W(x)< 0 \end{matrix}\right.(5.2.3)}

{\color{Red} W(x)}为两组距离判别的(线性)判别函数,称

  • 3
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值