mahout0.9朴素贝叶斯测试数据

本实验参考实验楼的  Mahout介绍、安装与应用案例

实验环境:centos7 64位

mahout0.9

1:下载数据:地址为 http://qwone.com/~jason/20Newsgroups/ ,下载20news-bydate.tar.gz数据包。

使用xftp将数据传输到centos7,解压,在mahout-0.9下新建data,将解压后的两个文件夹转移到data里:

tar -xzf 20news-bydate.tar.gz
mkdir /app/mahout-0.6/data
mv 20news-bydate-t* /app/mahout-0.6/data

在0.9版本的安装目录下$MAHOUT_HOME/examples/bin下有个脚本文件classifu-20newsgroups.sh,

这个脚本中执行过程是和前面分布执行结果是一致的,只不过将各个API用shell脚本封装到一起了。

从0.7版本开始,Mahout移除了命令行调用的API:prepare20newsgroups、trainclassifier和testclassifier,

只能通过shell脚本执行。执行 $MAHOUT_HOME/examples/bin/classify-20newsgroups.sh 四个选项中选择第一个选项,







评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值