matlab测试集验证集划分,用MATLAB的Classficiation Learner工具箱对12个数据集进行各种分类与验证...

本文探讨了通过预处理和特征选择提升分类算法(如Bayes、SVM、决策树)在数据集上的表现,以AUC为评估标准。通过对比原始特征集与子集特征,发现数据量大的JM1、MC1、PC5在分类效果上更优,小数据集则存在性能差距。
摘要由CSDN通过智能技术生成

准备材料

6f4547fd0c9862fc8d1e14d8e03f4cb5.png

以所有的特征集作为variable进行像Bayes吖、SVM吖、决策树吖......分类。同时对数据进行预处理,选出相关度高的特征子集作为新的一组data进行分类(预处理的代码不必放出来)。

Classficiation Learner工具箱的使用

从应用程序(APP)栏下的机器学习和深度学习可以get。

7333e84b1466a5d10e77f5c9fd85ebcb.png

NEW Session,从工作空间导入数据集。

fa5603b5991b3a1ed15087bee4b97742.png

Start Session。

bd924159116d7fb3c7022bbda92f4112.png

选择分类器进行train。

dbd31f00b9b4668318d7e5b177b7edb2.png

结果

AUC 值越大,说明该模型的性能越好。

以CM1为例:

原始特征集、决策树

6d33fff56ddb9c5b61af4113700d433c.png

原始特征集、SVM

ad769668d9c318b136aa99c91eb3f398.png

特征子集、决策树

d9cb5ea4c260cf3d7ed36a7b357d47cb.png

特征子集、SVM

131a641b081c768a93921f65506f7c80.png

全部数据的结果统计:

2f08d4f8223d4d52be7af6cd0ed06f1c.png

其中,百分数表示经过十次十折交叉验证进行循环测试,最后返回的准确率;分号右边表示计算得到的AUC大小。

从中我们可以看到像JM1、MC1、PC5这些数据量大的数据集,最后得到的计算结果相对较好,而对于一些数据量较小的数据集,训练出的结果部分存在差距。

原文:https://www.cnblogs.com/fangxiaoqi/p/12008833.html

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值