一、相关参考
1) Projection:快手对ClickHouse的重磅贡献
二十、问题汇总
1 Too many parts
1) 报错代码
Too many parts (607). Parts cleaning are processing significantly slower than inserts
2) 报错原因
a. 写出的动态分区太多;
b. 多任务并行,同时写出part太多,最好改成串行执行;
2 spark批量写出数据量异常
1)waterdrop写ck少数据
a. 生命周期删除了数据
2)waterdrop写ck多数据
a. spark任务重试, 会导致数据重复导出;