【数据挖掘软件 weka】第四部分更多的分类器

最新推荐文章于 2024-02-11 10:06:36 发布

问就ycy

最新推荐文章于 2024-02-11 10:06:36 发布

阅读量2.2k

点赞数 23

文章标签：数据挖掘机器学习人工智能

本文链接：https://blog.csdn.net/qq_44836691/article/details/126906318

版权

文章目录

一、分类边界
二、线性回归
三、回归分类
四、logistic回归
五、支持向量机
六、集成学习

一、分类边界

导入鸢尾花2d数据集，该数据集仅有花萼长、花萼宽、类别三个属性，打开weka首页的Visualization中的边界可视化（BoundaryVisualizer）,同样导入鸢尾花2d数据集。
在这里插入图片描述
边界可视化窗口选择OneR分类器，用训练数据作图等它散开，有色图标显示了决策分界线，训练数据叠加在分界上。

在这里插入图片描述
运行结果如下：

二、线性回归

导入软件自带的cpu训练集，它的分类是数字的，使用函数分类器中的线性回归，运行后得到输出。
在这里插入图片描述
使用公式时，可以看到对训练数据的成功率，它的相关系数为0.9。

在这里插入图片描述
树分类器下有M5P分类器，运行后创建一个模型树。

运行后的结果有92-93%的相关值，30的绝对平均误差等，同线性回归比，其相关值低些但绝对误差高些。

三、回归分类

线性回归只能用于数字类的数据集，载入名词类数据集的时候需要把分类标签转化为数字。
分类标签转化为数字，导入diabetes数据集时，若将分类转化至0/1，可以添加无监督的NormalToBinary属性过滤器，并将参数（应用属性索引）设为class的索引值。
在这里插入图片描述

但没有生效，原因是这些属性过滤器不能作用于类的值，将Class处设为No class，继续运行得到如下的结果。
在这里插入图片描述
此时便可以进行线性回归，点击More options，选择输出实例的预测结果的格式。

引入logistic回归
添加一个新的属性为classification，把预测的值赋给它，然后用OneR优化两种类别分割点。
使用监督的增加分类的属性过滤器，选择其参数为线性回归分类器，并将outputClassificatuin设为True，运行后将存储通过线性回归得到的数字，接下来将之前改为的数字分类转化为名词性类，使用ZeroR（无监督的NumericToNominal属性过滤器），在编号9的属性运行得到0/1标签，将class设为class换成彩色背景。
删除其他属性的值，仅保留class和classification，然后在分类界面使用OneR预测class。
在这里插入图片描述