第一篇博文之mysql表表连接查询和行列置换问题_mysql对groupby查询的结果集,关联另一张表的数据做数据替换-CSDN博客

本文链接：https://blog.csdn.net/dokia123/article/details/6653262

刚毕业工作一个月，进了家小公司，在看公司的代码过程中经常看到一些N长的sql语句，瞪着看半天都看不懂，本来接触数据库就少，而且也几年没碰过了，于是乎，便上网查了查，原来是关于表表连接查询和行列置换的。

于是乎，便在csdn上发了个帖子求助。然后问题顺利解决，接下来简单总结一下，方便自己以后要忘了还能回顾一下。

两个表：

表一：业绩表

+--------+------+------+
| mon | dep | yj |
+--------+------+------+
| 一月份 | 1 | 10 |
| 一月份 | 2 | 10 |
| 一月份 | 3 | 5 |
| 二月份 | 2 | 8 |
| 二月份 | 4 | 9 |
| 三月份 | 3 | 8 |
+--------+------+------+

表2：部门表

+------+--------+
| dep | dname |
+------+--------+
| 1 | 一部 |
| 2 | 二部 |
| 3 | 三部 |
| 4 | 国际部 |
+------+--------+

要得到如下结果：

dep dname 一月份二月份三月份
--------------------------------------
01 国内业务一部 10 null null
02 国内业务二部 10 8 null
03 国内业务三部 null 5 8
04 国际业务部 null null 9

问题解决了，我最大的感受就是，了解sql的执行顺序很重要，也许是我很长时间没碰过数据库了，貌似以前学数据库的时候这种知识点是最基础的东东，唉，竟然还有一点印象我。哈哈。下面具体说下我的思维过程：

第一步：首先两个表肯定是要连接查询的，所以我进行了连接查询的结果如下：

sql：select b.dep,b.dname,a.mon,a.yj from table1 a,table2 b where a.dep = b.dep;

第二步：进行初步的行列置换：

sql：

第三步：第二步中有重复数据，所以我们要做的就是去重，当然不是用distinct关键字，而是想group by 然后相加sum()，这里要注意的是：group by是在select 之前执行，也就是会在sum之前执行，所以，先按部门号dep分组，然后组内相加，就可以去重了。

sql:

顺便补充点刚才上网查才知道的知识(是我解决此问题的关键):

SQL 不同于与其他编程语言的最明显特征是处理代码的顺序。在大数编程语言中，代码按编码顺序被处理，但是在SQL语言中，第一个被处理的子句是FROM子句，尽管SELECT语句第一个出现，但是几乎总是最后被处理。

每个步骤都会产生一个虚拟表，该虚拟表被用作下一个步骤的输入。这些虚拟表对调用者（客户端应用程序或者外部查询）不可用。只是最后一步生成的表才会返回给调用者。如果没有在查询中指定某一子句，将跳过相应的步骤。下面是对应用于SQL server 2000和SQL Server 2005的各个逻辑步骤的简单描述。

 
  ( 
  8 
  ) 
  SELECT 
   ( 
  9 
  ) 
  DISTINCT 
    ( 
  11 
  ) 
  < 
  Top 
   Num 
  > 
    
  < 
  select 
   list 
  > 
  
 ( 
  1 
  ) 
  FROM 
    
  [ 
  left_table 
  ] 
  
 ( 
  3 
  ) 
  < 
  join_type 
  > 
    
  JOIN 
    
  < 
  right_table 
  > 
  
 ( 
  2 
  )         
  ON 
    
  < 
  join_condition 
  > 
  
 ( 
  4 
  ) 
  WHERE 
    
  < 
  where_condition 
  > 
  
 ( 
  5 
  ) 
  GROUP 
    
  BY 
    
  < 
  group_by_list 
  > 
  
 ( 
  6 
  ) 
  WITH 
    
  < 
  CUBE  
  | 
   RollUP 
  > 
  
 ( 
  7 
  ) 
  HAVING 
    
  < 
  having_condition 
  > 
  
 ( 
  10 
  ) 
  ORDER 
    
  BY 
    
  < 
  order_by_list 
  > 
 

逻辑查询处理阶段简介

FROM：对FROM子句中的前两个表执行笛卡尔积（Cartesian product)(交叉联接），生成虚拟表VT1
ON：对VT1应用ON筛选器。只有那些使<join_condition>为真的行才被插入VT2。
OUTER(JOIN)：如果指定了OUTER JOIN（相对于CROSS JOIN 或(INNER JOIN),保留表（preserved table：左外部联接把左表标记为保留表，右外部联接把右表标记为保留表，完全外部联接把两个表都标记为保留表）中未找到匹配的行将作为外部行添加到 VT2,生成VT3.如果FROM子句包含两个以上的表，则对上一个联接生成的结果表和下一个表重复执行步骤1到步骤3，直到处理完所有的表为止。
WHERE：对VT3应用WHERE筛选器。只有使<where_condition>为true的行才被插入VT4.
GROUP BY：按GROUP BY子句中的列列表对VT4中的行分组，生成VT5.
CUBE|ROLLUP：把超组(Suppergroups)插入VT5,生成VT6.
HAVING：对VT6应用HAVING筛选器。只有使<having_condition>为true的组才会被插入VT7.
SELECT：处理SELECT列表，产生VT8.
DISTINCT：将重复的行从VT8中移除，产生VT9.
ORDER BY：将VT9中的行按ORDER BY 子句中的列列表排序，生成游标（VC10).
TOP：从VC10的开始处选择指定数量或比例的行，生成表VT11,并返回调用者。

注：步骤10，按ORDER BY子句中的列列表排序上步返回的行，返回游标VC10.这一步是第一步也是唯一一步可以使用SELECT列表中的列别名的步骤。这一步不同于其它步骤的是，它不返回有效的表，而是返回一个游标。SQL是基于集合理论的。集合不会预先对它的行排序，它只是成员的逻辑集合，成员的顺序无关紧要。对表进行排序的查询可以返回一个对象，包含按特定物理顺序组织的行。ANSI把这种对象称为游标。理解这一步是正确理解SQL的基础。

因为这一步不返回表（而是返回游标），使用了ORDER BY子句的查询不能用作表表达式。表表达式包括：视图、内联表值函数、子查询、派生表和共用表达式。它的结果必须返回给期望得到物理记录的客户端应用程序。例如，下面的派生表查询无效，并产生一个错误：

select * 
from(select orderid,customerid from orders order by orderid) 
as d

下面的视图也会产生错误

create view my_view
as
select *
from orders
order by orderid

在SQL中，表表达式中不允许使用带有ORDER BY子句的查询，而在T—SQL中却有一个例外（应用TOP选项）。

所以要记住，不要为表中的行假设任何特定的顺序。换句话说，除非你确定要有序行，否则不要指定ORDER BY 子句。排序是需要成本的，SQL Server需要执行有序索引扫描或使用排序运行符。

唉，还是我太菜了，这么个简单问题我都能弄一天。加油！！！哈哈哈！！！