大数据工程师
技能图谱
大数据通用处理平台
Hadoop
Spark
分布式数据存储
HDFS
资源调度
Yarn
Mesos
数据分析/数据仓库
Hive
SparkSQL
Pig
Kylin
消息队列
Kafka
RabbitMQ
日志收集
Flume
流式计算
Storm/JStorm
Spark Streaming
编程语言
Scala
Java
Python
机器学习库
Mahout
MLlib
Hadoop家族
zookeeper
Hbase
Hue
Sqoop
Oozie
必备技能
Java高级
虚拟机、并发
Linux 基本操作
Hadoop
HDFS+MapReduce+Yarn
HBase
JavaAPI操作+Phoenix
Hive
Hql基本操作和原理理解
Kafka
Storm/JStorm
Scala
Python
Spark
Core+sparksql+Spark streaming
辅助小工具
Sqoop/Flume/Oozie/Hue等