目录
前言——距离判别不适合的一个例子
研究的指标是英语六级考试成绩(满分710分)。
(校研究生组):
(校本科生组):
研究生中的有1000人,本科生组中
的有2000人。某学生
,试该判别该生归属哪一组?
该例如采用距离判别法则显然不妥,应考虑利用如下的先验概率:
距离判别方法简单,结论明确,是很实用的方法,但该方法也有缺点:
- 该判别与各总体出现的机会大小(先验概率)完全无关
- 判别方法没有考虑错判造成的损失,这是不合理的
判别正是为解决这两方面问题而提出的判别方法。
的统计思想总是假定对所研究的对象已有一定的认识,常用先验概率分布来描述这种认识。然后我们抽取一个样本,用样本修正已有的认识(先验概率分布),得到后验概率分布。
各种统计推断都通过后验概率分布来进行,将贝叶斯思想用于判别分析就得到贝叶斯判别法。
一、最大后验概率法
1.含义
设有个组
,且组
的概率密度为
,样品
来自组
的先验概率为
,满足
。则
属于
的后验概率为
最大后验概率法是采用如下的判别规则:
2.【例5.3.1】
3.先验概率的赋值方法
- 利用历史资料及经验进行估计,例如某地区成年人中得癌症的概率为
,不患癌的概率为
- 利用训练样本中各类样品所占的比例,即
,这时要求训练样本是随机抽样取得的,各类样品被抽到的机会大小就是先验概率
- 没有任何先验信息时,取等概率
4.皆为正态组的情形
设,这时组
的概率密度为
此时,后验概率为: