关闭

在SQL Server 2005中实现表的行列转换

251人阅读 评论(0) 收藏 举报

PIVOT和UNPIVOT关系运算符是SQL Server 2005提供的新增功能,因此,对升级到SQL Server 2005的数据库使用PIVOT和UNPIVOT时,数据库的兼容级别必须设置为90(可以使用sp_dbcmptlevel存储过程设置兼容级别)。
在查询的FROM子句中使用PIVOT和UNPIVOT,可以对一个输入表值表达式执行某种操作,以获得另一种形式的表。PIVOT运算符将输入表的行旋转为列,并能同时对行执行聚合运算。而UNPIVOT运算符则执行与PIVOT运算符相反的操作,它将输入表的列旋转为行。
在FROM子句中使用PIVOT和UNPIVOT关系运算符时的语法格式如下:
[ FROM { <table_source> } [ ,...n ] ]
<table_source> ::=
{
    table_or_view_name [ [ AS ] table_alias ]
    <pivoted_table> | <unpivoted_table>
}
<pivoted_table> ::=
        table_source PIVOT <pivot_clause> table_alias
 
<pivot_clause> ::=
        ( aggregate_function ( value_column )
        FOR pivot_column
        IN ( <column_list> )
    )
 
<unpivoted_table> ::=
        table_source UNPIVOT <unpivot_clause> table_alias
 
<unpivot_clause> ::=
        ( value_column FOR pivot_column IN ( <column_list> ) )
 
<column_list> ::=
          column_name [ , ... ]
table_source PIVOT <pivot_clause>
指定对table_source表中的pivot_column列进行透视。table_source可以是一个表、表表达式或子查询。
aggregate_function
系统或用户定义的聚合函数。注意:不允许使用COUNT(*)系统聚合函数。
value_column
PIVOT运算符用于进行计算的值列。与UNPIVOT一起使用时,value_column不能是输入table_source中的现有列的名称。
FOR pivot_column
PIVOT运算符的透视列。pivot_column必须是可隐式或显式转换为nvarchar()的类型。
使用UNPIVOT时,pivot_column是从table_source中提取输出的列名称,table_source中不能有该名称的现有列。
IN ( column_list )
在PIVOT子句中,column_list列出pivot_column中将成为输出表的列名的值。
在UNPIVOT子句中,column_list列出table_source中将被提取到单个pivot_column中的所有列名。
table_alias
输出表的别名。
UNPIVOT < unpivot_clause >
指定将输入表中由column_list指定的多个列的值缩减为名为pivot_column的单个列。
常见的可能会用到PIVOT的情形是:需要生成交叉表格报表以汇总数据。交叉表是使用较为广泛的一种表格式,例如,图5-4所示的产品销售表就是一个典型的交叉表,其中的月份和产品种类都可以继续添加。但是,这种格式在进行数据表存储的时候却并不容易管理,要存储图5-4这样的表格数据,数据表通常需要设计为图5-5这样的结构。这样就带来一个问题,用户既希望数据容易管理,又希望能够生成一种能够容易阅读的表格数据。好在PIVOT为这种转换提供了便利。
           
             图5-4 产品销售表                                     图5-5 数据表结构
假设Sales.Orders表中包含有ProductID(产品ID)、OrderMonth(销售月份)和SubTotal(销售额)列,并存储有如表5-2所示的内容。
表5-2                                                                    Sales.Orders表中的内容
ProductID
OrderMonth
SubTotal
1
5
100.00
1
6
100.00
2
5
200.00
2
6
200.00
2
7
300.00
3
5
400.00
3
5
400.00
执行下面的语句:
SELECT ProductID, [5] AS 五月, [6] AS 六月, [7] AS 七月
FROM
   Sales.Orders PIVOT
   (
   SUM (Orders.SubTotal)
   FOR Orders.OrderMonth IN
   ( [5], [6], [7] )
    ) AS pvt
ORDER BY ProductID;
在上面的语句中,Sales.Orders是输入表,Orders.OrderMonth是透视列(pivot_column),Orders.SubTotal是值列(value_column)。上面的语句将按下面的步骤获得输出结果集:
a.PIVOT首先按值列之外的列(ProductID和OrderMonth)对输入表Sales.Orders进行分组汇总,类似执行下面的语句:
SELECT ProductID,
   OrderMonth,
   SUM (Orders.SubTotal) AS SumSubTotal
FROM Sales.Orders
GROUP BY ProductID,OrderMonth;
这时候将得到一个如表5-3所示的中间结果集。其中只有ProductID为3的产品由于在5月有2笔销售记录,被累加到了一起(值为800)。
表5-3                                                            Sales.Orders表经分组汇总后的结果
ProductID
OrderMonth
SumSubTotal
1
5
100.00
1
6
100.00
2
5
200.00
2
6
200.00
2
7
300.00
3
5
800.00
b.PIVOT根据FOR Orders.OrderMonth IN指定的值5、6、7,首先在结果集中建立名为5、6、7的列,然后从图5-3所示的中间结果中取出OrderMonth列中取出相符合的值,分别放置到5、6、7的列中。此时得到的结果集的别名为pvt(见语句中AS pvt的指定)。结果集的内容如表5-4所示。
表5-4                                         使用FOR Orders.OrderMonth IN( [5], [6], [7] )后得到的结果集
ProductID
5
6
7
1
100.00
100.00
NULL
2
200.00
200.00
200.00
3
800.00
NULL
NULL
c.最后根据SELECT ProductID, [5] AS 五月, [6] AS 六月, [7] AS 七月FROM的指定,从别名pvt结果集中检索数据,并分别将名为5、6、7的列在最终结果集中重新命名为五月、六月、七月。这里需要注意的是FROM的含义,其表示从经PIVOT关系运算符得到的pvt结果集中检索数据,而不是从Sales.Orders中检索数据。最终得到的结果集如表5-5所示。
表5-5                                        由表5-2所示的Sales.Orders表将行转换为列得到的最终结果集
ProductID
五月
六月
七月
1
100.00
100.00
NULL
2
200.00
200.00
200.00
3
800.00
NULL
NULL
UNPIVOT与PIVOT执行几乎完全相反的操作,将列转换为行。但是,UNPIVOT并不完全是PIVOT的逆操作,由于在执行PIVOT过程中,数据已经被进行了分组汇总,所以使用UNPIVOT并不会重现原始表值表达式的结果。假设表5-5所示的结果集存储在一个名为MyPvt的表中,现在需要将列标识符“五月”、“六月”和“七月”转换到对应于相应产品ID的行值(即返回到表5-3所示的格式)。这意味着必须另外标识两个列,一个用于存储月份,一个用于存储销售额。为了便于理解,仍旧分别将这两个列命名为OrderMonth和SumSubTotal。参考下面的语句:
CREATE TABLE MyPvt (ProductID int, 五月int, 六月 int, 七月int); --建立MyPvt表
GO
--将表5-5中所示的值插入到MyPvt表中
INSERT INTO MyPvt VALUES (1,100,100,0);
INSERT INTO MyPvt VALUES (2,200,200,200);
INSERT INTO MyPvt VALUES (3,800,0,0);
 
--执行UNPIVOT
SELECT ProductID, OrderMonth, SubTotal
FROM
   MyPvt UNPIVOT
   (SubTotal FOR OrderMonth IN
      (五月, 六月, 七月)
)AS unpvt;
上面的语句将按下面的步骤获得输出结果集:
a.首先建立一个临时结果集的结构,该结构中包含MyPvt表中除IN (五月, 六月, 七月)之外的列,以及SubTotal FOR OrderMonth中指定的值列(SubTotal)和透视列(OrderMonth)。
b.将在MyPvt中逐行检索数据,将表的列名称(在IN (五月, 六月, 七月)中指定)放入OrderMonth列中,将相应的值放入到SubTotal列中。最后得到的结果集如表5-6所示。
表5-6                                                                使用UNPIVOT得到的结果集
ProductID
OrderMonth
SubTotal
1
五月
100
1
六月
100
1
七月
0
2
五月
200
2
六月
200
2
七月
200
3
五月
800
3
六月
0
3
七月
0

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:870752次
    • 积分:8126
    • 等级:
    • 排名:第2469名
    • 原创:240篇
    • 转载:125篇
    • 译文:0篇
    • 评论:145条
    最新评论