《机器学习工具与方法》--- WEKA实战二

最新推荐文章于 2024-05-23 13:48:51 发布

心永向阳

最新推荐文章于 2024-05-23 13:48:51 发布

阅读量1.3k

点赞数

分类专栏： WEKA 机器学习文章标签：机器学习算法

本文链接：https://blog.csdn.net/HORHEART/article/details/120806265

版权

2 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

《机器学习工具与方法》— WEKA实战二

题目：Glass.arff-Classify-Ibk-10折交叉验证选择元学习器FilteredClassifier-IBk分类器，并选择AddNoise无监督属性过滤进行数据分析，同时可以根据数据画图进行结果分析。

解答：

导入玻璃数据集，分类器中选中weka.classifiers.meta.FilteredClassifier，选择元学习器weka.classifiers.lazy.IBk，即k邻近算法进行分类，同时选中过滤器weka.filters.unsupervised.attribute.AddNoise以增加数据噪声。操作截图如下：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传
设置K邻近算法的K分别等于1,2,3 ，设置噪声百分比从0%增加到100%，进行分类正确率的汇总：

噪声百分比	K = 1	K = 2	K = 3
0%	70.56	67.75	71.96
10%	61.21	66.82	70.56
20%	52.80	60.74	65.88
30%	45.79	55.14	61.24
40%	36.92	47.20	50.00
50%	33.18	41.12	43.46
60%	27.57	36.92	38.79
70%	20.56	28.97	29.91
80%	16.82	22.90	23.83
90%	12.62	17.29	19.63
100%	6.07	7.94	7.01

表格单位填写的是在叠加噪声后数据在K邻近算法下的十折交叉验证分类正确率。

题目：选择两个分类器进行实验，比较Glass-Ibk-J48、FilteredClassifier-Resample，进行不同采样百分比，进行分类实验。

解答：

导入glass数据集，分类器选中FilteredClassifier，其中classifier选中Ibk（K邻近 K=1）或J48（决策树），Filter选中resemple（重采样大小设置为10%~100%）操作如下图所示：
不断修改重采样比率填写下表：

填入数据为算法在对应重采样下的分类准确率，单位为%。

关注