ClickHouse单表数据重复如何去重

一.数据表数据一致且翻倍

这里准备了两个测试表,表一为原表,表二为重复表

#1.ReplacingMergeTree引擎去重
CREATE TABLE salaries3
ENGINE = ReplacingMergeTree
ORDER BY (emp_no, salary, from_date, to_date) AS
SELECT *
FROM salaries2

#2.聚合去重,可以适用于字段较少的表
CREATE TABLE salaries4
ENGINE = MergeTree
ORDER BY emp_no AS
SELECT
    emp_no,
    salary,
    from_date,
    to_date
FROM salaries2
GROUP BY
    emp_no,
    salary,
    from_date,
    to_date

一般生产环境的表都会有更新字段,数据更新的话,如何去掉老数据可以参考我的另一篇

ClickHouse取最新值_clickhouse 怎么按最新时间取一系列数值-CSDN博客

  • 12
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值