昨晚写bug的时候,突然发现了这个问题,比如我group by 一个字段,我不小心把这个字段加上了引号。这个时候我发现结果不正确了。
例如一个网关的日志数据统计,属性就是年月日小时api,然后还有一些关于请求数统计等。我的需求就是根据年月日做一个group by,正常是可以统计出来的
但是如果我对这些字段加上引号之后,就会出现如下的情况,只有一条数据。
如果做sum的话其实就是把所有的数据都分到了一个组里
这让我产生了疑惑。正常情况下group by 后面就是接table的属性,或者是数字,数字其实也是属性。因为通过explain 再 show warnings之后,就会发现实际上是一样的。但是加字符串的话,即便是explain解析的结果还是字符串。
后来我就查看group by 的原理,这里很多地方都能找到,我就不贴链接了。我似乎明白了,group by 本质上是根据某些属性,来做分组,但是如果写字符串就是每条数据分组都是根据一个常量,所以他们都会分到同一个组去。如果我思考的原理是对的话,我让每条数据的分组给它搞成随机的常量呢?
于是我设计了一个随机数 Round(Rand()*10) ,然后作为group by 的字段,按照原理来分析的话,就是随机分配给每条数据一个0-10的值,其实类似随机分组。结果如下:
并且执行多次的结果不一样,从效果上确实是实现了随机分组的情况。
但是这样我只是做了一个黑盒的测试,究竟里面是否是按照我的猜想执行不得而知,看看是否有大佬能查看到具体的执行过程,可以更好的解释这个过程。