SQL的“单值规则”
1、select product_id,MAX(date_reported) as latest,bug_id
from Bugs join BugsProducts USING (bug_id)
group by product_id;
很多时候,我们觉得返回的cc列的bug_id值应该是查询表中max(date_reported)对应的那条数据的值,但是实际上并非如此。数据库会根据结果集中的值选择,因为是根据product_id分组,所以product_id的值是唯一的,然后会在分组中选取MAX(date_reported),也就是date_reported的最大值,此时product_id和date_reported还是保持原有数据的对应关系,但是由于在分组后bug_id值会有很多,无法找到对应的值,此时违反了SQL的单值规则。
2、同理,如果查询的不是bug_id,而是max(bug_id)或者min(bug_id),则没有违反单值原则,但是查询到的两列数据可能失去准确性,查询的三个列的值可能会是一个原有结果集的组合数据而不是原有结果集的原声数据。
3、对于mysql数据库,当违反单值原则时会找找实际的物理存储顺序来寻找数据
4、通常违反单值规则的提示为:
MYSQL 5.1: 'id' isn't in GROUP BY
ORACLE 10.2:not a GROUP BY expression
5、解决方案:
(1)去掉违反单值规则的列
(2)通过子查询来查找准确的值