Linux系统: 大数据相关软件都是在Linux上运行的
java: 标准版JavaSE( Java的方向有JavaSE、JavaEE、JavaME)
先从JavaSE+Linux开始
python(以及各种类库)
hadoop(基于linux的分布式文件系统)
hive()
oozie
web
flume
hbase
kafka
scala
spark(一种计算引擎)
ps:内容很多是网上整理组合的