【鸢尾花数据集最小错误率贝叶斯分类】

最新推荐文章于 2024-04-26 10:44:16 发布

VIP文章 YUAN秦慕楚

最新推荐文章于 2024-04-26 10:44:16 发布

阅读量2.2k

点赞数 3

文章标签：分类机器学习算法 matlab

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/YCBen2020/article/details/125524000

版权

一、问题描述
——鸢尾花数据集最小错误率贝叶斯分类
iris是鸢尾植物数据集，存储了其萼片和花瓣的长宽，共4个特征属性（记萼长为属性1，萼宽为属性2，花瓣长为属性3，花瓣宽为属性4），鸢尾植物分三类。该数据集一共包含4个特征变量，1个类别变量。共有150个样本，鸢尾有三个亚属，分别是山鸢尾 (Iris-setosa，即类别1)，变色鸢尾(Iris-versicolor，即类别2)和维吉尼亚鸢尾(Iris-virginica，即类别3)。现在基于最小错误率贝叶斯决策，根据不同的特征属性对测试样本进行分类，使得分类结果的错误率最小。

二、实现思想
原理：在一般的模式识别问题中，人们的目标往往是尽量减少分类的错误，追求最小的错误率，即求解一种决策规则，使得

这就是基于最小错误率的贝叶斯决策。
由P（e｜x）≥0，P（x）≥0对于所有的x均成立，故minP（e）等同于对所有的x最小化P（e｜x），即使后验概率P（ωi｜x）最大化。根据贝叶斯公式

对于所有类别，分母都是相同的，所以决策的时候实际上只需要比较分子，即

先验概率P（ωi）和类条件概率密度P（x｜ωi）是已知的。概率密度P（x｜ωi）反映了在ωi类中观察到特征值x的相对可能性。
对于多类别决策，错误率的计算量较大，可以转化为计算平均正确率P（c）来计算错误率：

步骤：
（1）对数据进行处理
在每个类别的样本中分别取40个样本，作为训练样本（共120个），余下样本作为测试样本（共30个），
（2）求出每类训练样本的均值
（3）求出每类训练样本的协方差矩阵
（4）求出每类训练样本的协方差矩阵的逆矩阵
（5）求出每类训练样本的协方差矩阵的行列式值
（6）求出各类别的先验概率和后验概率

三、结果展示
运行程序得测试样本分类图界面，这里每次取3个不同特征属性进行多次实验作出分类图（图1，图2，图3，图4）
ps：为了让分类图更直观，部分图是经过旋转得来的。

最低0.47元/天解锁文章

关注

3
点赞
踩
19

收藏

觉得还不错? 一键收藏
1
评论
【鸢尾花数据集最小错误率贝叶斯分类】

鸢尾花数据集最小错误率贝叶斯分类
复制链接

扫一扫

博客等级

码龄4年

3
原创

5
点赞

27
收藏

0
粉丝

关注

私信

热门文章

最新评论

matlab二分法小题
is_meng_xin: 为什么我显示未定义函数或变量 'f'。啊

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。