一、实验目的
- 巩固4种基本的分类算法的算法思想:朴素贝叶斯算法,决策树算法,人工神经网络,支持向量机算法;
- 能够使用现有的分类器算法代码进行分类操作
- 学习如何调节算法的参数以提高分类性能;
二、实验的软、硬件平台
硬件:计算机
软件:操作系统:WINDOWS
应用软件:C,Java或者Matlab
三、实验内容及步骤
利用现有的分类器算法对文本数据集进行分类
实验步骤
此次实验使用weka软件来模拟各种分类、回归算法的运行结果,并比较优劣
首先打开weka软件,在四个选项中选择explorer
打开后选择处理后的arff文件,打开后发现当前页面已经给出了关于标签的一些信息:
首先打开分类数据集,然后在classify标签页中选择我们想要查看现象的算法,如果我们选择的算法不符合数据集的格式,那么我们不可以单击start按钮。