Weka之训练与测试数据

本文介绍了机器学习中训练数据和测试数据的概念,以及在Weka中如何进行训练和测试数据的处理。通过实验展示了使用训练集、设置测试集、交叉验证和按比例划分数据的四种方法,分析了它们的特点和效果,强调了交叉验证在提高模型准确性上的优势,但同时也指出其在大数据量时的计算成本问题。
摘要由CSDN通过智能技术生成

什么是训练数据和测试数据?
训练数据经过机器学习算法(ML Algorithm)可以得到分类器,再将测试数据放入分类器,则可得到评估结果。

在这里插入图片描述
训练集和测试集应来源于同一个数据集,但为两个不相交的集合。比如:将一个数据集的1/3作为测试集,2/3作为训练集。

接下来通过一个简单的实验进一步理解训练与测试数据:
1、打开Explorer界面,选择数据集segment-challenge.arff。
2、打开classify面板,选择J48分类器。
在这里插入图片描述

3、观察Test options面板,共有4种方式来评价模型效果,分别是:
Use traning set 使用训练集Supplied test set设置测试集Cross-validation交叉验证Percentage split按比划分
以下将介绍四种方法的区别。

●使用训练集

选择后,点击start。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值