一、问题描述
渔民在捕鱼的时候,经常会遇到这样一种情况:一张渔网打捞上来的鱼既有三文鱼又有鲈鱼,但它们的特征各不同。假定三文鱼和鲈鱼两类数据(length、light)服从高斯分布,随机生成数据,并附标签。
完成以下问题:
1) 建立数学模型,使用距离分类器及线性分类器对数据集进行分类,使得分类准确率最高。
2) 考虑方差和先验概率对分类的影响。
说明:本实验报告使用MATLAB实现。
二、实验过程
问题1:
对于问题1的求解,进行如下操作:
Step 1:生成实验数据。分别设置三文鱼及鲈鱼的长度、亮度信息,具体如表1所示。利用正态分布随机生成三文鱼和鲈鱼样本数据各2000组,其中,训练样本、测试样本各1000组。标签为0代表三文鱼、1代表鲈鱼;
表1 三文鱼及鲈鱼的长度、亮度信息
|
三文鱼 |
鲈鱼 |
||
长度 |
亮度 |
长度 |
亮度 |
|
均值 |
20 |
100 |
40 |
150 |
方差 |
30 |
200 |
100 |