
知乎实时数仓架构演进
“数据智能” (Data Intelligence) 有一个必须且基础的环节,就是数据仓库的建设,同时,数据仓库也是公司数据发展到一定规模后必然会提供的一种基础服务。从智能商业的角度来讲,数据的结果代本文主要讲述知乎的实时数仓实践以及架构的演进,这包括以下几个方面实时数仓 1.0 版本,主题: ETL 逻辑实时化,技术方案:Spark Streaming。实时数仓 2.0 版本,主题:数据分层,指标计算
Sqoop
Kudu
大数据项目
实时数仓
离线数仓
Canal
Hive
面试
Flink
ETL
软件
Kubernetes
Docker
Datax
Flume
MySQL
Scala
hadoop
MapReduce
HDFS
Kafka
爬虫
requests
NoSql
Redis
Mongodb
Python
Lombok
Spark
笔记
bug
HBASE
hue
impala
zookeeper
Linux
Shell
分区
