Spark+Hadoop+Mahout大数据系列

大数据概述

Hadoop大数据分析生态环境;

数据分析与大数据分析:

(1)描述性分析:平均值、标准差;同比、环比发展速度;分位数、众数;

(2)数理统计分析:抽样估计;假设检验;方差分析;

(3)数据挖掘方法:聚类分析; 分类分析(决策树、神经网络、支持向量机、随机森林);关联规则;协同过滤;

(4)大数据分析:Hadoop(HDFS、mapreduce、hbase、mahout【聚类、分类、协同过滤】);spark;storm;

大数据学习之路

优秀的数据分析师的五维:

业务知识+SQL查询+精通一种大数据分析工具+熟练掌握大数据分析和建模的方法+良好的沟通能力;

第一阶段:系统架构篇

(1)大数据概述

(2)Linux操作系统

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值