大数据之路——index

数据的生命周期:

 

理论储备:

数据仓库:基本概念,数仓体系,数据仓库架构,数据采集,数据ETL, 数据存储,数仓建模,数仓分层,数据计算(分析,挖掘),数据查询,数据治理,调度

技术栈:

日志采集 :Logstash , flume,logagent

业务数据抽取:Sqoop,Datax,Canal

离线数据处理:hadoop,Spark, Sparksql  ,hive,hivesql,mapreduce,sql

实时数据处理:Sparkstreaming ,flink,storm

数据查询:Presto,Impala,Kylin

调度系统:Airflow ,azkaban ,oozie (工作流引擎)

资源管理:yarn

消息中间件:Kafka

编程语言:Java,python ,scala,Shell

数据存储:Hdfs ,hbase,elasticsearch ,Redis,mysql, Oracle, NoSql, mongodb

OLAP:Druid,Kylin

报表展示:Kibana,PowerBI,tableau

实时数仓:Kafka+flink+clickhouse

系统:linux

其他相关:

clickhouse,greenplum,doris,druid,kylin,superset等olap mpp技术,等OLAP和数据可视化

dubbo,Spring,Netty,GRPC等主流框架

Kudu

TiDB

Docker容器化

Kubernetes组件

Impala

K8s架构

presto

Hudi

Iceberg

zookeeper

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值