Weka的命令行构建分类器

最新推荐文章于 2024-05-29 10:58:09 发布

一条兔子

最新推荐文章于 2024-05-29 10:58:09 发布

阅读量652

点赞数

分类专栏：生信分析文章标签：机器学习

本文链接：https://blog.csdn.net/tu__zi/article/details/105687081

版权

生信分析专栏收录该内容

4 篇文章 7 订阅

订阅专栏

Weka的命令行构建分类器

文章目录

Weka的命令行构建分类器

将数据处理成csv数据

训练集

weka输入的训练集要求输入的数据：行是样本，列是基因，最后一列是label，不需要样本名。可以使用wps打开对数据处理成weka需要的样式。

测试集

同样的我们也选择一些样本作为测试集，不同的是label那一列都用?(英文)代替，记得保存一份有标签的备份，最后得出结果的时候可以判断模型的效果

将csv数据转化为arff文件

使用weka打开我们的train.csv.arff和test.csv.arff文件

首先点击Explorer- openfile，选择我们的文件，然后再点击save，点击确定，weka就自动将文件转化为arff文件了
用notepad++打开train.csv.arff和test.csv.arff文件，下拉到label这一行，将numeric改成{0,1}(英文)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rLH3E3uI-1587545538191)(E:%5Cmd%E6%96%87%E4%BB%B6%5C%E6%96%87%E4%BB%B6%E5%9B%BE%E5%83%8F%5Carff-1587539446537.png)]

如果前面的处理都正确的话，再次用weka打开train.csv.arff应该如下所示：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9pimSkXh-1587545538205)(E:%5Cmd%E6%96%87%E4%BB%B6%5C%E6%96%87%E4%BB%B6%E5%9B%BE%E5%83%8F%5Cweka.png)]

使用命令行构建模型和测试模型

构建模型

首先在自己的数据目录下打开cmd窗口
运行以下命令：

java -Xmx1024m -classpath .;D:\Weka\Weka-3-8-4\weka.jar weka.classifiers.trees.RandomForest -t train.csv.arff -d colonRandomForest.model > colonRandomForest.out -x 8

其中**D:\Weka\Weka-3-8-4\ **是你weka的安装目录
weka.classifiers.trees.RandomForest意思是选择随机森林构建模型，其他方法的目录也可以看weka软件，比如：

如果我们要选择NaiveBayes构建模型，我们就可以使用weka.classifiers.bayes.NaiveBayes

测试模型

java -Xmx1024m -classpath .;D:\Weka\Weka-3-8-4\weka.jar weka.classifiers.trees.RandomForest -l colonRandomForest.model -T test.csv.arff -p 0 > PredictionResultRandomForest.txt