引言
大数据的处理:
收集、整合、清洗、储存、计算、结果可视化、系统运维
全栈工程师:
后台(代码开发+系统运维)+前台(前端)+产品需求和文档整理
大数据岗位出现了明显的分化:
1、大数据开发工程师
hadoop工程师、spark工程师、算法工程师
2、大数据可视化工程师
之前的前段进化(数据分析)
3、大数据的运维
系统的运维、集群的运维
4、大数据的处理技术体系
hadoop hadoop生态体系 以hadoop为主的一整个离线处理的技术栈
storm 实时的流计算框架 类似于队列思维的消息缓存组件
spark 特别火 spark技术栈
1、Hadoop快速入门
1.1、数据: