如何快速地把HDFS中的数据导入Clickhouse
如何快速地把HDFS中的数据导入ClickhouseClickHouse是面向OLAP的分布式列式DBMS。我们部门目前已经把所有数据分析相关的日志数据存储至ClickHouse这个优秀的数据仓库之中,当前日数据量达到了300亿。之前介绍的有关数据处理入库的经验都是基于实时数据流,数据存储在Kafka中,我们使用Java或者Golang将数据从Kafka中读取、解析、清洗之后写入ClickHo...
本人目前在新浪做微博图片、CDN、云计算等业务的海量日志实时分析,主要使用Elasticsearch, Logstash, Kibana, Spark, Docker等技术。有事请联系:garygaowork@gmail.com