1、主要工作
(1)以身高为例,画出男女生身高的直方图并做对比;
(2)采用最大似然估计方法,求男女生身高以及体重分布的参数;
(3)采用贝叶斯估计方法,求男女生身高以及体重分布的参数
(4)采用最小错误率贝叶斯决策,画出类别判定的决策面。并对样本的身高体重分别为(160,45)及(178,70)时进行分类判别。
2、工作具体内容
2.1 以身高为例,画出男女生身高的直方图并做对比
这里重点是要从样本数据.xls中分别读取到男生女生的身高,并记录到相应数据中然后在直方图中分别显示男女身高频数。
本程序采用for循环方法将男生女生身高体重分别读取到man_h,man_w,woman_h,woman_w,最后用hist函数显示频数直方图。
Matlab 代码:
%--------------------------数据读取---------------------------------
clear all;
[n,t,r]= xlsread('样本数据');
l=1;m=1;
for k=1:149 %样本容量为149
if n(k,2)==1
man_h(l)=n(k,4);
man_w(l)=n(k,5);
l=l+1;
else
woman_h(m)=n(k,4);
woman_w(m)=n(k,5);
m=m+1;
end
end
%--------------------------------------------------------------------
%------------------------男女生身高的直方图对比-------------------------
figure(1)
subplot(2,1,1),
hist(man_h), title('男生身高直方图'),xlabel('身高/cm'),ylabel('频数');
subplot(2,1,2),
hist(woman_h), title('女生身高直方图'),xlabel('身高/cm'),ylabel('频数');
%--------------------------------------------------------------------
结果如下图所示:
图2.1 男生女生身高频数直方图
从图中可以看出男生女生身高近似与正态分布,可知在大容量样本空间中分布将更接近于正态分布。