mahout

Mahout是一个基于Hadoop的机器学习框架,提供了包括K-Means在内的多种算法。本文介绍了如何在Hadoop环境下安装Mahout,以及如何运用K-Means进行数据聚类,通过实例展示了算法的运行过程和结果。
摘要由CSDN通过智能技术生成

应用场景

Mahout 是一个基于 Hadoop 的机器学习和数据挖掘的分布式计算框架,封装实现了大量数据挖掘经典算法,为 Hadoop 开发人员提供了数据建模的标准,从而大大降低了大数据应用中并行挖掘产品的开发难度。在掌握了 Mahout 之后,Hadoop 开发人员可以直接调用相关算法模型的接口,方便、快捷地创建智能应用程序,从而大幅提升商业智能软件的大数据分析能力。

操作步骤

1.引言

下面给出一个应用场景:
比如你是一个拥有众多藏书的图书馆馆长,但是图书馆里面的藏书全部都是混乱无序的。来到图书馆看书的读者如果要找一本书,则相当麻烦。如果所有的图书是按照书名首字母排序的,那么查找图书就会变得容易得多;或者你也可以按照图书的主题来分类。因此,你需要按照某种规则来把图书排成一列,当遇到与之前规则一样的图书,就可以把它们放在一起;当你遍历完所有读书时,众多的书籍已经被分成了若干类,一遍 聚类 也就完成了。如果你觉得第一遍聚类的结果还不够精细,你还可以进行第二遍聚类,直到结果令人满意为止。

2.简介

Hadoop在之

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

bingoabin

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值