ClickHouse字段分组取TOP N

最新推荐文章于 2024-03-13 14:49:49 发布

龙卷风摧毁停车场

最新推荐文章于 2024-03-13 14:49:49 发布

阅读量7.5k

点赞数 2

分类专栏： clickhouse 文章标签： sql

本文链接：https://blog.csdn.net/weixin_41385446/article/details/117262086

版权

clickhouse 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

在clickhouse中通过字段进行分组排序最后取所需要的前N条

记录一下分组取TOP N的经验，以后说不定有机会要翻出来看一下当时的思路，在此先声明，本人只是初学者，写的SQL语句很烂。我在这里只是记录一下我在学习过程中遇到的某种案例的解决思路，并不是标准答案

查询要求

按产品维度统计2017年每月的业绩，指标包括不同品类的采购量、采购额，每个产品里采购量top 10的商品

解决思路

1、先对产品和产品类别里的所有商品进行分组排序处理，分组先后顺序是产品 --> 月份 --> 商品，得出产品维度下每月所有的商品采购额的排序表t，排序方式是将采购额降序处理，即采购额从多到少的方式

SELECT 
	a1.chanpinID,
	a1.chanpinming ,
	toYear(a.dingdanriqi) as nian,
	toMonth(a.dingdanriqi) as yue,
	a.shangpinID,
	a.shangpinming ,
	SUM(a.caigouliang) as pfshu,
	SUM(a.caigoue) as cge
FROM 
	dingdanbiao a
left join chanpinbiao a1 on a.chanpID = a1.chanpinID
where 
	toYear(a.dingdanriqi) = 2017
group by 
	a1.chanpinID ,
	a1.chanpinming ,
	a.shangpinID ,
	a.shangpinming ,
	nian,
	yue
order by
	a1.chanpinID ASC ,
	yue,
	cge DESC

2、通过clickehouse的groupArray（）函数将t表里的每个产品每个月采购额排名前10的商品的ID存放进groupArray数组里

SELECT 
	chanpinID,
	chanpinming,
	nian,
	yue,
	groupArray(10)(shangpinID) as shpin
from
	(SELECT 
		a1.chanpinID,
		a1.chanpinming ,
		toYear(a.dingdanriqi) as nian,
		toMonth(a.dingdanriqi) as yue,
		a.shangpinID,
		a.shangpinming ,
		SUM(a.caigouliang) as pfshu,
		SUM(a.caigoue) as cge
	FROM 
		dingdanbiao a
	left join chanpinbiao a1 on a.chanpID = a1.chanpinID
	where 
		toYear(a.dingdanriqi) = 2017
	group by 
		a1.chanpinID ,
		a1.chanpinming ,
		a.shangpinID ,
		a.shangpinming ,
		nian,
		yue
	order by
		a1.chanpinID ASC ,
		yue,
		cge DESC)
group by 
	chanpinID,
	chanpinming,
	yue,
	nian  
order by 
	chanpinID ,
	yue

3、再通过array join将存放在groupArray数组里的shangpinID取出来形成前10商品ID表t1

SELECT 
	chanpinID,
	chanpinming,
	nian,
	yue,
	shpin
FROM 
	(SELECT 
	    chanpinID,
		chanpinming,
		nian,
		yue,
		groupArray(10)(shangpinID) as shpin
    from
		(SELECT 
			a1.chanpinID,
			a1.chanpinming ,
			toYear(a.dingdanriqi) as nian,
			toMonth(a.dingdanriqi) as yue,
			a.shangpinID,
			a.shangpinming ,
			SUM(a.caigouliang) as pfshu,
			SUM(a.caigoue) as cge
		FROM 
			dingdanbiao a
		left join chanpinbiao a1 on a.chanpID = a1.chanpinID
		where 
			toYear(a.dingdanriqi) = 2017
		group by 
			a1.chanpinID ,
			a1.chanpinming ,
			a.shangpinID ,
			a.shangpinming ,
			nian,
			yue
		order by
			a1.chanpinID ASC ,
			yue,
			cge DESC)
	group by 
		chanpinID,
		chanpinming,
		yue,
		nian  
	order by 
		chanpinID ,
		yue)
ARRAY JOIN shpin

4、最后通过内连接inner join匹配排序表t和前10商品表t1，下面是整体的SQL语句

SELECT
	t.chanpinID as pleiID,
	t.chanpinming as plei,
	t.nian ,
	t.yue,
	t.shangpinID as spinID,
	t.shangpinming as spin,
	t.caigouliang,
	t.caigoue
FROM 
	(SELECT 
		a1.chanpinID,
		a1.chanpinming ,
		toYear(a.dingdanriqi) as nian,
		toMonth(a.dingdanriqi) as yue,
		a.shangpinID,
		a.shangpinming ,
		SUM(a.caigouliang) as pfshu,
		SUM(a.caigoue) as cge
	FROM 
		dingdanbiao a
		left chanpinbiao a1 on a.chanpID = a1.chanpinID
	where 
		toYear(a.dingdanriqi) = 2017
	group by 
		a1.chanpinID ,
		a1.chanpinming ,
		a.shangpinID ,
		a.shangpinming ,
		nian,
		yue
	order by
		a1.chanpinID ASC ,
		yue,
		cge DESC) t
inner join 
	(SELECT 
		chanpinID,
		chanpinming,
		nian,
		yue,
		shpin
	FROM 
		(SELECT 
			chanpinID,
			chanpinming,
			nian,
			yue,
			groupArray(10)(shangpinID) as shpin
		from
			(SELECT 
				a1.chanpinID,
				a1.chanpinming ,
				toYear(a.dingdanriqi) as nian,
				toMonth(a.dingdanriqi) as yue,
				a.shangpinID,
				a.shangpinming ,
				SUM(a.caigouliang) as pfshu,
				SUM(a.caigoue) as cge
			FROM 
				dingdanbiao a
			left join chanpinbiao a1 on a.chanpID = a1.chanpinID
			where 
				toYear(a.dingdanriqi) = 2017
			group by 
				a1.chanpinID ,
				a1.chanpinming ,
				a.shangpinID ,
				a.shangpinming ,
				nian,
				yue
			order by
				a1.chanpinID ASC ,
				yue,
				cge DESC)
		group by 
			chanpinID,
			chanpinming,
			yue,
			nian  
		order by 
			chanpinID ,
			yue)
	ARRAY JOIN shpin) t1
on t1.shpin = t.chanpID and t1.yue = t.yue

运行上面的SQL语句后最后输出的结果就是所需要的结果表