技术选型的主要考虑因素:数据量大小,业务需求,行业内经验,技术成熟度,开发维护成本,总成本预算。
1.技术选型框架
- 数据采集传输:flume,kafka,sqoop,logstash,dataX
- 数据存储:mysql,hdfs,hbase,redis,mongoDB
- 数据计算:hive,tez,spark,flink,storm
- 数据查询:presto,druid,impala,kylin
- 数据可视化:echarts,superset,quickBI,dataV
- 任务调度:azkaban,oozie
- 集群监控:zabbix
- 元数据管理:atlas
- 数据质量管理:griffin