hive中实现行转列_SQL Server 动态行转列(参数化表名、分组列、行转列字段、字段值)...

c26c139ff0c35d02eebec9ac346c3c8e.gif更多精彩,请点击上方蓝字关注我们! 7e66773063b0ccd001c041bec59001a0.png今天跟大家分享SQL Server 动态行转列(参数化表名、分组列、行转列字段、字段值)的知识。

一.本文所涉及的内容(Contents)

  1. 本文所涉及的内容(Contents)

  2. 背景(Contexts)

  3. 实现代码(SQL Codes)

    1. 方法一:使用拼接SQL,静态列字段;

    2. 方法二:使用拼接SQL,动态列字段;

    3. 方法三:使用PIVOT关系运算符,静态列字段;

    4. 方法四:使用PIVOT关系运算符,动态列字段;

    5. 扩展阅读一:参数化表名、分组列、行转列字段、字段值;

    6. 扩展阅读二:在前面的基础上加入条件过滤;

二.背景(Contexts)

其实行转列并不是一个什么新鲜的话题了,甚至已经被大家说到烂了,网上的很多例子多多少少都有些问题,所以我希望能让大家快速的看到执行的效果。

所以在动态列的基础上再把表、分组字段、行转列字段、值这四个行转列固定需要的值变成真正意义的参数化,大家只需要根据自己的环境,设置参数值,马上就能看到效果了(可以转至:“参数化动态PIVOT行转列”查看具体的脚本代码)。行转列的效果图如图1所示:

558ac86a6fffa233bb9253ee9df848a3.png

(图1:行转列效果图)

三.实现代码(SQL Codes)

(一) 首先我们先创建一个测试表,往里面插入测试数据,返回表记录如图2所示:

--创建测试表IF  EXISTS (SELECT * FROM sys.objects WHERE object_id = OBJECT_ID(N'[dbo].[TestRows2Columns]') AND type in (N'U'))DROP TABLE [dbo].[TestRows2Columns]GOCREATE TABLE [dbo].[TestRows2Columns](    [Id] [int] IDENTITY(1,1) NOT NULL,    [UserName] [nvarchar](50) NULL,    [Subject] [nvarchar](50) NULL,    [Source] [numeric](18, 0) NULL) ON [PRIMARY]GO--插入测试数据INSERT INTO [TestRows2Columns] ([UserName],[Subject],[Source])     SELECT N'张三',N'语文',60  UNION ALL    SELECT N'李四',N'数学',70  UNION ALL    SELECT N'王五',N'英语',80  UNION ALL    SELECT N'王五',N'数学',75  UNION ALL    SELECT N'王五',N'语文',57  UNION ALL    SELECT N'李四',N'语文',80  UNION ALL    SELECT N'张三',N'英语',100GOSELECT * FROM [TestRows2Columns]

81c30e64d7d583106e12a3fc20e352c1.png

(图2:样本数据)

(二) 先以静态的方式实现行转列,效果如图3所示:

--1:静态拼接行转列SELECT [UserName],SUM(CASE [Subject] WHEN '数学' THEN [Source] ELSE 0 END) AS '[数学]',SUM(CASE [Subject] WHEN '英语' THEN [Source] ELSE 0 END) AS '[英语]',SUM(CASE [Subject] WHEN '语文' THEN [Source] ELSE 0 END) AS '[语文]'     FROM [TestRows2Columns]GROUP BY [UserName]GO

28edfda8746d71bb169c5c83d29ee6cf.png

(图3:样本数据)

(三) 接着以动态的方式实现行转列,这是使用拼接SQL的方式实现的,所以它适用于SQL Server 2000以上的数据库版本,执行脚本返回的结果如图2所示;

--2:动态拼接行转列DECLARE @sql VARCHAR(8000)SET @sql = 'SELECT [UserName],'   SELECT @sql = @sql + 'SUM(CASE [Subject] WHEN '''+[Subject]+''' THEN [Source] ELSE 0 END) AS '''+QUOTENAME([Subject])+''','   FROM (SELECT DISTINCT [Subject] FROM [TestRows2Columns]) AS a     SELECT @sql = LEFT(@sql,LEN(@sql)-1) + ' FROM [TestRows2Columns] GROUP BY [UserName]'   PRINT(@sql)EXEC(@sql)GO

(四) 在SQL Server 2005之后有了一个专门的PIVOT 和 UNPIVOT 关系运算符做行列之间的转换,下面是静态的方式实现的,实现效果如图4所示:

--3:静态PIVOT行转列SELECT  *FROM    ( SELECT    [UserName] ,                    [Subject] ,                    [Source]          FROM      [TestRows2Columns]        ) p PIVOT( SUM([Source]) FOR [Subject] IN ( [数学],[英语],[语文] ) ) AS pvtORDER BY pvt.[UserName];GO

c989c29202aabb5996ef440f2672418b.png

(图4)

(五) 把上面静态的SQL基础上进行修改,这样就不用理会记录里面存储了什么,需要转成什么列名的问题了,脚本如下,效果如图4所示:

--4:动态PIVOT行转列DECLARE @sql_str VARCHAR(8000)DECLARE @sql_col VARCHAR(8000)SELECT @sql_col = ISNULL(@sql_col + ',','') + QUOTENAME([Subject]) FROM [TestRows2Columns] GROUP BY [Subject]SET @sql_str = 'SELECT * FROM (    SELECT [UserName],[Subject],[Source] FROM [TestRows2Columns]) p PIVOT     (SUM([Source]) FOR [Subject] IN ( '+ @sql_col +') ) AS pvt ORDER BY pvt.[UserName]'PRINT (@sql_str)EXEC (@sql_str)

(六) 也许很多人到了上面一步就够了,但是你会发现,当别人拿到你的代码,需要不断的修改成他自己环境中表名、分组列、行转列字段、字段值这几个参数,逻辑如图5所示,所以,我继续对上面的脚本进行修改,你只要设置自己的参数就可以实现行转列了,效果如图4所示:

--5:参数化动态PIVOT行转列-- =============================================-- Author:        -- Create date: <2014.05.26>-- Description:    -- Blog:        -- =============================================DECLARE @sql_str NVARCHAR(MAX)DECLARE @sql_col NVARCHAR(MAX)DECLARE @tableName SYSNAME --行转列表DECLARE @groupColumn SYSNAME --分组字段DECLARE @row2column SYSNAME --行变列的字段DECLARE @row2columnValue SYSNAME --行变列值的字段SET @tableName = 'TestRows2Columns'SET @groupColumn = 'UserName'SET @row2column = 'Subject'SET @row2columnValue = 'Source'--从行数据中获取可能存在的列SET @sql_str = N'SELECT @sql_col_out = ISNULL(@sql_col_out + '','','''') + QUOTENAME(['+@row2column+'])     FROM ['+@tableName+'] GROUP BY ['+@row2column+']'--PRINT @sql_strEXEC sp_executesql @sql_str,N'@sql_col_out NVARCHAR(MAX) OUTPUT',@sql_col_out=@sql_col OUTPUT--PRINT @sql_colSET @sql_str = N'SELECT * FROM (    SELECT ['+@groupColumn+'],['+@row2column+'],['+@row2columnValue+'] FROM ['+@tableName+']) p PIVOT     (SUM(['+@row2columnValue+']) FOR ['+@row2column+'] IN ( '+ @sql_col +') ) AS pvt ORDER BY pvt.['+@groupColumn+']'--PRINT (@sql_str)EXEC (@sql_str)

a8eb13bede725b4e64dc1363434e7dc3.png

(图5)

(七) 在实际的运用中,我经常遇到需要对基础表的数据进行筛选后再进行行转列,那么下面的脚本将满足你这个需求,效果如图6所示:

--6:带条件查询的参数化动态PIVOT行转列-- =============================================-- Author:        -- Create date: <2014.05.26>-- Description:    -- Blog:        -- =============================================DECLARE @sql_str NVARCHAR(MAX)DECLARE @sql_col NVARCHAR(MAX)DECLARE @sql_where NVARCHAR(MAX)DECLARE @tableName SYSNAME --行转列表DECLARE @groupColumn SYSNAME --分组字段DECLARE @row2column SYSNAME --行变列的字段DECLARE @row2columnValue SYSNAME --行变列值的字段SET @tableName = 'TestRows2Columns'SET @groupColumn = 'UserName'SET @row2column = 'Subject'SET @row2columnValue = 'Source'SET @sql_where = 'WHERE UserName = ''王五'''--从行数据中获取可能存在的列SET @sql_str = N'SELECT @sql_col_out = ISNULL(@sql_col_out + '','','''') + QUOTENAME(['+@row2column+'])     FROM ['+@tableName+'] '+@sql_where+' GROUP BY ['+@row2column+']'--PRINT @sql_strEXEC sp_executesql @sql_str,N'@sql_col_out NVARCHAR(MAX) OUTPUT',@sql_col_out=@sql_col OUTPUT--PRINT @sql_colSET @sql_str = N'SELECT * FROM (    SELECT ['+@groupColumn+'],['+@row2column+'],['+@row2columnValue+'] FROM ['+@tableName+']'+@sql_where+') p PIVOT     (SUM(['+@row2columnValue+']) FOR ['+@row2column+'] IN ( '+ @sql_col +') ) AS pvt ORDER BY pvt.['+@groupColumn+']'--PRINT (@sql_str)EXEC (@sql_str)

c0378edb71db660941460e6b523014d4.png

(图6)

今天就分享这么多,关于SQL Server 动态行转列(参数化表名、分组列、行转列字段、字段值),你学会了多少?欢迎在留言区评论

图文 / 来源网络

版权归原作者所有,侵联删

855da5926294144c78097b430afa5089.png

c0a157ad66a8fea4de43a9e3b6afd784.pngEND

a622f518956b83b9f89f4d15973ee875.png

碧茂课堂精彩课程推荐:

1.Cloudera数据分析课;

2.Spark和Hadoop开发员培训;

3.大数据机器学习之推荐系统;

4.Python数据分析与机器学习实战;

f9cf855977b61d7d260dd869c48cfefa.png

详情请关注我们公众号:碧茂大数据-课程产品-碧茂课堂

现在注册互动得海量学币,大量精品课程免费送!

d010abc80ec36deba81370fe3ee18382.png

关注最新行业动态,

加群进行技术交流!

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 可以使用Hive的TRANSPOSE函数对字段进行行转列操作。该函数将行数据转换为数据,可以方便地进行数据透视和分析。使用方法如下: SELECT TRANSPOSE(col_name) FROM table_name; 其,col_name为需要进行行转列字段名,table_name为数据表名。 ### 回答2: Hive是一个基于Hadoop的数据仓库工具,它提供了一种将结构化的数据映射到Hadoop分布式文件系统(HDFS)的方法。Hive支持使用HiveQL查询语言进行数据分析和数据查询。 在Hive,要对字段进行行转列函数操作,可以使用HiveQL的"pivot"操作。Pivot操作是将行的数据转换为的过程,可以通过对数据进行透视操作来实现。 首先,需要使用HiveQL的"SELECT"语句选择要进行行转列操作的数据。然后,使用HiveQL的"PIVOT"关键字指定要转换为字段名称。通过指定"PIVOT"关键字后的字段名,Hive会将这些字段作为新的进行展示。最后,可以使用"GROUP BY"语句对转换后的数据进行聚合操作。 例如,假设我们有一个包含日期、地点和销售额的数据表。我们想要将地点作为,日期作为行,并以销售额填充单元格。以下是一个示例HiveQL查询语句: ``` SELECT * FROM (SELECT date, location, sales FROM sales_table) src PIVOT (SUM(sales) FOR location IN ('location1', 'location2', 'location3')) as result ``` 上述查询语句,首先选择了date、location和sales字段。然后,通过"PIVOT"关键字指定了要转换为字段"location",并使用"SUM"函数对sales字段进行聚合操作。最后,通过"GROUP BY"语句对转换后的数据进行分组。 通过以上的HiveQL查询,我们可以将原始的行数据转换为数据,并按照指定的格式显示。这样,我们就可以更方便地进行数据分析、数据查询和报表生成等操作。 ### 回答3: Hive是一种基于Hadoop的数据仓库工具,它提供了一种SQL接口,用于查询和分析大规模的数据。在Hive,可以使用TRANSPOSE函数对字段进行行转列操作。 Hive的TRANSPOSE函数用于将一数据转换成多行数据,适用于将宽表转换为长表的场景。TRANSPOSE函数需要指定需要转置的以及转置后生成的新的名称。 假设我们有一个包含用户ID和用户偏好的表,其用户ID为主键,用户偏好分为三个字段:音乐偏好、电影偏好和运动偏好。现在我们想将这三个字段转换成一,其名为偏好类型,为用户偏好的具体内容。可以使用TRANSPOSE函数实现这个转换过程。 具体的操作如下: 1. 创建一个新表,包含用户ID和偏好类型两个字段。 2. 使用INSERT INTO SELECT语句将原表的用户ID和三个偏好字段插入到新表。 3. 使用TRANSPOSE函数对偏好字段进行行转列操作,将其转换成多行数据,其每一行包含用户ID和一个偏好类型的。 4. 最后,将转置后的数据插入到新表的偏好类型字段。 通过以上操作,我们就可以将原表的偏好字段行转列成一,方便后续的查询和分析操作。 总而言之,Hive提供了TRANSPOSE函数来对字段进行行转列操作,可以方便地将宽表转换为长表,便于数据的处理和分析。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值