项目中有时需求没有搞的很清楚,就开始按照自己的想象去做,而我们想象的需求和实际的需求还是有一些差距的,
这往往会导致不必要的返工。今天就犯了这个错误,本来要统计是从已经提供好的当天的随机和top的1W Query的数据源
的东东,结果自己以为query_log就是要统计的数据源,然后还试图去如何随机选取query,而query_log是超过5000w级别
的query数,top query的倒是好办,大数据量的随机,还是很难办的,弄了一整天,后来才发现数据源根本是搞错了。
项目中有时需求没有搞的很清楚,就开始按照自己的想象去做,而我们想象的需求和实际的需求还是有一些差距的,
这往往会导致不必要的返工。今天就犯了这个错误,本来要统计是从已经提供好的当天的随机和top的1W Query的数据源
的东东,结果自己以为query_log就是要统计的数据源,然后还试图去如何随机选取query,而query_log是超过5000w级别
的query数,top query的倒是好办,大数据量的随机,还是很难办的,弄了一整天,后来才发现数据源根本是搞错了。