多元统计分析之判别分析

最新推荐文章于 2024-01-30 19:01:10 发布

Statistic_Code

最新推荐文章于 2024-01-30 19:01:10 发布

阅读量371

点赞数

文章标签：多元

本文链接：https://blog.csdn.net/qq_40268680/article/details/120934452

版权

这篇博客详细介绍了判别分析在多元统计分析中的应用，以血友病携带者判断为例，阐述了如何从两总体到多总体的分类问题，并通过期望错分代价（ECM）和总的错分概率（TPM）准则来确定最优分类规则。同时，讨论了二次判别函数和线性判别函数的概念，以及在实际应用中如何估计分类性能和错误率。

摘要由CSDN通过智能技术生成

Discriminant Analysis

1.引言

分类是我们经常会遇到的任务,分类的目的是把目标对象划分到正确的类别中，或者说给它打上正确的类别标签。

2.例子：血友病携带者的判断

从血液样本中测量下述两项指标:
自身血友病因子对数值: 在这里插入图片描述
类抗原对数值:

然后分成2组:

判别分析其实就是寻找到类似图中橙色虚线的这种 $\textcolor{red}{rule(规则)}$ 来判断目前包括将来的样本点是属于哪一类的:
在这里插入图片描述

3.分类:从两总体到多总体

3.1 Classification into One of Two Populations

符号:
(1) $\Pi_i,i=1,2$ 表示两个总体;
(2) $\bold{X}_{p\times 1}$ 表示随机变量，它的观测值在不同总体间是有一定程度差异的；
(3)这两个总体由 $f_1(\bold{X}),f_2(\bold{X})$ 描述;
(4)设样本空间为 $\Omega$ , 我们想要将样本空间划分成两个不相交的子空间: $\Omega=R_1 \bigcup R_2,R_1\bigcap R_2=\empty$ .
我们认为如果 $\bold{X}_0\in R_1$ ，那么就把它划分到 $\Pi_1$ 中，否则就划分到 $\Pi_2$ 中.