最近做了一个报表,有卡号,账号,开户机构,卡号有重复的,卡可以下挂多个账号,账号的开户机构可能不同。
想要将开户机构分组,统计每个开户机构的卡量。于是写了一个语句,
select open_org,count(distinct card_no) from card_info
group by open_org;
写完之后,就有些嘀咕,是先分组后在去重呢,还是去重后在分组呢?其实这里我有些概念不清,一般用distinct的时候,只是取这个字段,如果这样写
select distinct card_no,acc_no from card_info;
会全部显示,因为假如真能去重的话,那留下的那个,对应哪个acc_no呢。所以是分组之后,才去重的。也就是将机构分组,再去将同一个机构中重复的卡号过滤掉。
但是这在业务上也有个问题,如果一个卡号下的账号分别在不同的机构开户的,那么这张卡在分组之后依然会有重复的。所以这么分组还是有问题。
如果先将卡号去重的话,保留哪个开户行呢,啊,上班后再研究,说的话题有些跑偏了。。。。