- 博客(0)
- 收藏
- 关注
用MATLAB鸢尾花数据集学习并且做聚类分析
根据这个代码段所执行的任务是使用 K-Means 算法对数据进行聚类:
1. 该算法使用 `csvread` 函数从提供的文件中加载测试数据和训练数据集合,并将它们组合成一个数据集。
2. 使用 `zscore` 函数标准化数据,这可以使不同特征的口袋数量变得可以比较。
3. 使用 `kmeans` 函数对标准化的数据集进行 K-Means 聚类分析,使用 k=4 作为聚类数量。
4. 生成图表以将所有聚类可视化,其中每个聚类对应一个颜色标记。图表还会显示每个聚类的中心点。
结论:此算法将数据集分成了四个不同的聚类子集,每个聚类子集的重心是图表中的黑色十字。此模型的最终结果应根据该数据集和问题的特定上下文来解释,同时应使用其他技术和知识进一步分析和验证结论。
2023-07-08
MATLAB做两类问题Fisher准则的设计与实现
一、实验内容
1.了解Fisher线性判决用于样本分类的算法原理。
2.利用Matlab编写算法程序,自选一组分别属于三类的三维模式样本A,并对它们进行分类。
二、实验原理
Fisher判别分析法对样本数据也没什么要求,而且可以弥补距离判别在外延计算时计算大的问题,一般情况下,其判别的效果也比距离判别更好些。由于Fisher判别分析法不需要对样本数据进行检验,而且有一定的正确率,因此在实际中被广泛应用。
假设有一组集合 包含n个d维样本 ,其中n1个属于w1的样本记为 ,n2个属于w2的样本记为 ,
若 则每个yn就是相对应Xn在方向为w的直线上的投影,w的方向不同,样本投影后的分离程度不同,从而直接影响识别效果。
Fisher线性判别所要解决的基本问题是找到一个最好的投影方向,使样本这个方向上的投影能最好,最易于分类。寻找最好投影方向的问题在数学上就是寻找最好变换向量w*的问题。因此Fisher判别分析的基本思想就是投影,即将k类n维数据投影到某个方向,使组与组间的距离最大,即采用方差分析的思想。判别函数的参数向量如下:
在D维X空间:
(1)各样本均值向量
(2)样本内
2023-07-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人