我在mysql 命令行这个系列里介绍过有条件查询,它用到WHERE子句。但是有时候用WHERE子句无法给我们的查询加入条件,比如在上一节我们学习的GROUP BY(按组归类)子句,如果我们要在按组归类后加入条件,用WHERE就行不通,因为WHERE只可以在按组归类前加入条件。好在mysql提供HAVING子句,它可以帮我们解决这个问题。
如何使用HAVING子句?
首先,让我们看一个GROUP BY(按组归类)的子句应用:
select title, AVG(salary)from employee_dataGROUP BY title;+----------------------------+-------------+
| title | AVG(salary) |+----------------------------+-------------+
| CEO | 200000.0000 || Customer Service Manager | 70000.0000 || Finance Manager | 120000.0000 || Marketing Executive | 77333.3333 || Multimedia Programmer | 83333.3333 || Programmer | 75000.0000 || Senior Marketing Executive | 120000.0000 || Senior Programmer | 115000.0000 || Senior Web Designer | 110000.0000 || System Administrator | 95000.0000 || Web Designer | 87500.0000 |+----------------------------+-------------+
11 rows in set (0.00 sec)
上述例子把员工职务按组分类并且把各个职务的平均工资列出。如果我们只想列出平均工资大于100000的职务,就要用到HAVING子句,如下:
select title, AVG(salary)from employee_dataGROUP BY titleHAVING AVG(salary) > 100000;+----------------------------+-------------+
| title | AVG(salary) |+----------------------------+-------------+
| CEO | 200000.0000 || Finance Manager | 120000.0000 || Senior Marketing Executive | 120000.0000 || Senior Programmer | 115000.0000 || Senior Web Designer | 110000.0000 |+----------------------------+-------------+
5 rows in set (0.00 sec)
注意在这种情况下,用WHERE子句是行不通的!
MySQL中UNION
在数据库中,UNION和UNION ALL关键字都是将两个结果集合并为一个,但这两者从使用和效率上来说都有所不同。
MySQL中的UNION
UNION 在进行表链接后会筛选掉重复的记录,所以在表链接后会对所产生的结果集进行排序运算,删除重复的记录再返回结果。实际大部分应用中是不会产生重复的记录,最常见的是过程表与历史表UNION。如:
select * from gc_dfys union select * from ls_jg_dfys
这个SQL在运行时先取出两个表的结果,再用排序空间进行排序删除重复的记录,最后返回结果集,如果表数据量大的话可能会导致用磁盘进行排序。
MySQL中的UNION ALL
而UNION ALL只是简单的将两个结果合并后就返回。这样,如果返回的两个结果集中有重复的数据,那么返回的结果集就会包含重复的数据了。
从效率上说,UNION ALL 要比UNION快很多,所以,如果可以确认合并的两个结果集中不包含重复的数据的话,那么就使用UNION ALL,如下:
select * from gc_dfys union all select * from ls_jg_dfys
使用Union,则所有返回的行都是唯一的,如同您已经对整个结果集合使用了DISTINCT
使用Union all,则不会排重,返回所有的行
如果您想使用ORDER BY或LIMIT子句来对全部UNION结果进行分类或限制,则应对单个地SELECT语句加圆括号,并把ORDER BY或LIMIT放到最后一个的后面:
(SELECT a FROM tbl_name WHERE a=10 AND B=1)
UNION
(SELECT a FROM tbl_name WHERE a=11 AND B=2)
ORDER BY a LIMIT 10;
麻烦一点也可以这么干:
select userid from (
select userid from testa union all select userid from testb) t
order by userid limit 0,1;
如果你还想 group by,而且还有条件,那么:
select userid from (select userid from testa union all select userid from testb) t group by userid having count(userid) = 2;
注意:在union的括号后面必须有个别名,否则会报错
当然了,如果当 union的几个表的数据量很大时,建议还是采用先导出文本,然后用脚本来执行
因为纯粹用sql,效率会比较低,而且它会写临时文件,如果你的磁盘空间不够大,就有可能会出错
Error writing file '/tmp/MYLsivgK' (Errcode: 28)