大数据学习思路分解(2):机器学习

机器学习是整套大数据学习线路里的第二部分内容,知识点相对来说不是很多,但也是大数据开发中最常用的一部分内容。

240

那么我们就开始对机器学习部分要学习的知识点进行个整理:

1、r语言机器学习

r语言是一款十分优秀的数据分析和数据可视化软件,同时作为第一代机器学习的工具,其中包括大量用于机器学习的添加包。

此部分需要掌握:r语言简单的介绍、基本函数、数据类型、线性回归、朴素贝叶斯聚类、决策树分类、神经网络等等

2、Mahout机器学习

Mahout提供一些可扩展的机器学习领域经典算法的实现,很多公司会使用Mahout方便快捷地创建智能应用程序。Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。Mahout通过使用 Apache Hadoop,可以有效地扩展到云中。

此部分需要掌握:使用的原因、配置安装及步骤说明、分类概念、工作原理等等

3、项目实战

项目实战以微博营销数据挖掘项目为主,主要运用到的框架体系有

a)分布式平台 Hadoop,MapReduce

b) 数据采集 Flume

c) 数据清洗 ETL

d) 数据库 Hbase,Redis

e) 机器学习 Mahout

640

小伙伴们需要系统的学习资料可以给我留言哦,或者找文章内的qq直接加我好友领取。

转载于:https://my.oschina.net/u/3445485/blog/1820997

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值