随机森林算法的使用

本文档介绍了如何使用Hadoop和Mahout库建立随机森林模型。首先通过`Describe`命令描述数据,接着使用`BuildForest`构建随机森林,最后用`TestForest`进行模型测试和评估。主要涉及的参数包括数据输入路径、描述文件、随机选取属性数量、决策树个数等。
摘要由CSDN通过智能技术生成

数据格式:

1,1.52101,13.64,4.49,1.10,71.78,0.06,8.75,0.00,0.00,1
2,1.51761,13.89,3.60,1.36,72.73,0.48,7.83,0.00,0.00,1
3,1.51618,13.53,3.55,1.54,72.99,0.39,7.78,0.00,0.00,1
4,1.51766,13.21,3.69,1.29,72.61,0.57,8.22,0.00,0.00,1
5,1.51742,13.27,3.62,1.24,73.08,0.55,8.07,0.00,0.00,1
6,1.51596,12.79,3.61,1.62,72.97,0.64,8.07,0.00,0.26,1
7,1.51743,13.30,3.60,1.14,73.09,0.58,8.17,0.00,0.00,1
8,1.51756,13.15,3.61,1.05,73.24,0.57,8.24,0.00,0.00,1
9,1.51918,14.04,3.58,1.37,72.08,0.56,8.30,0.00,0.00,1

一、生成描述文件

命令:hadoop jar mahout-examples-0.9-job.jar org.apache.mahout.classifier.df.tools.Describe

--path(-p)                                 任务的输入路径,必选

--file(-f)                                      任务的描述文件路径,必选

--descriptor(-d)                         输入数据的描述,可选

--regression(-r)                        指名使用回归或者分类,默认是分类  ,可选

--help<

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值