大数据概述
Hadoop大数据分析生态环境;
数据分析与大数据分析:
(1)描述性分析:平均值、标准差;同比、环比发展速度;分位数、众数;
(2)数理统计分析:抽样估计;假设检验;方差分析;
(3)数据挖掘方法:聚类分析; 分类分析(决策树、神经网络、支持向量机、随机森林);关联规则;协同过滤;
(4)大数据分析:Hadoop(HDFS、mapreduce、hbase、mahout【聚类、分类、协同过滤】);spark;storm;
大数据学习之路
优秀的数据分析师的五维:
业务知识+SQL查询+精通一种大数据分析工具+熟练掌握大数据分析和建模的方法+良好的沟通能力;
第一阶段:系统架构篇
(1)大数据概述
(2)Linux操作系统