判别分析(待添加)

判别分析是一种统计方法,用于根据观测指标推断个体所属类型。本文介绍了判别分析的定义、原理,以及最大似然法、距离判别、Fisher判别和Bayes判别的概念和应用。这些方法在不同条件下适用于不同类型的数据,如分类变量、连续变量,以及存在先验概率的情况。
摘要由CSDN通过智能技术生成

1.定义
判别分析(distinguish analysis)是根据所研究的个体的观测指标来推断该个体所属
类型的一种统计方法,在自然科学和社会科学的研究中经常会碰到这种统计问题。例如
在地质找矿中我们要根据某异常点的地质结构、化探和物探的各项指标来判断该异常点
属于哪一种矿化类型;医生要根据某人的各项化验指标的结果来判断该人属于什么病
症;调查了某地区的土地生产率、劳动生产率、人均收入、费用水平、农村工业比重等
指标,来确定该地区属于哪一种经济类型地区等等。该方法起源于1921 年Pearson 的
种族相似系数法,1936 年Fisher 提出线性判别函数,并形成把一个样本归类到两个总体之一的判别法。

2.原理
从概率论的角度看,可把判别问题归结为如下模型。设共有 n个总体:ξ1 , ξ2, … ,ξn,其中ξi是m 维随机变量,其分布函数为Fi(x1 ,x2, … ,xm ) ,i = 1,2,…,n。而(x1 ,x2, … ,xm )是表征总体特性的m 个随机变量的取值。在判别分析中称这m 个变量为判别因子。现有一个新的样本点y = (y1 ,y2, … ,ym ),要判断此样本点属于哪一个总体。

下面介绍最基本的几种判别方法:最大似然法,距离判别,Bayes判别和Fisher 判别。判别方法是确定待判样品归属于哪一组的方法,可分为参数法和非参数法,也可以根据资料的性质分为定性资料的判别分析和定量资料的判别分析。此处给出的分类主要是根据采用的判别准则分出几种常用方法。除最大似然法外,其余几种均适用于连续性资料。

3.最大似然法
用于自变量均为分类变量的情况,该方法建立在独立事件概率乘法定理的基础上,根据训练样品信息求得自变量各种组合情况下样品被封为任何一类的

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值