C4.5算法是一种较成熟的异常检测算法,如果学习这个算法,只需要学习怎么使用它既可。
C4.5程序分析
1. 使用方法
1)C45 –f golf (golf.data为数据文件名 ),生成golf.tree文件,即只创建树。
2)C45 –u golf(golf.data为数据文件名),除生成golf.tree文件,还使用evaluate方法进行完整性检测,生成正确率和错误率,并且生成预测类。
2. 算法流程
1)输入接口
获取相应的一些参数
2) 参数
-f :为FileName赋值,以进行读文件操作
-u :除了有-f的所有功能外,又增加了为UNSEENS赋值的功能,目的是对读取的数据进行检测并预测。
3)输出接口