使用不同的测试数据和训练数据很重要。
只有一组数据怎么办,把数据分为两部分
J48
不能直接选择use training set 再重新开始,会产生误导性结果
只有一个数据集可以按照百分比分割(数据分割是随机的)
不同分割会带来不同结果。运行前wake会初始化随机数生成器,确保相同分割结果同。可以设置随机数修改相同分割的结果。
设置随机种子(做交叉验证或百分比分割)
输出分类器源代码
通过更改随机种子,多运行几次,再取平均值得到新的准确率,计算平均值,标准差
使用不同的测试数据和训练数据很重要。
只有一组数据怎么办,把数据分为两部分
J48
不能直接选择use training set 再重新开始,会产生误导性结果
只有一个数据集可以按照百分比分割(数据分割是随机的)
不同分割会带来不同结果。运行前wake会初始化随机数生成器,确保相同分割结果同。可以设置随机数修改相同分割的结果。
设置随机种子(做交叉验证或百分比分割)
输出分类器源代码
通过更改随机种子,多运行几次,再取平均值得到新的准确率,计算平均值,标准差