- 博客(1)
- 收藏
- 关注
原创 一种巧妙的hive sql数据去重方法
在处理hive数据时,有时会遇到带重复数据的表如下:idinfotimestamp1a16195775152b16195799951c1619577516我们想根据id去重,又想只保留时间戳(timestamp)最新的数据。这时就有一种巧妙的方法去重, sql如下:select a.id, a.info, a.timestampfrom( select *, row_number() over (partition by use
2021-04-28 10:59:44 3073
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人