SQL 行转列,列转行

 给定如下模拟数据集,这也是SQL领域经典的学生成绩表问题。两张期望的数据表分别如下:

1)长表:

scoreLong

2)宽表:

scoreWide

考察的问题就是通过SQL语句实现在这两种形态间转换,其中长表转为宽表即行转列,宽表转为长表即列转行。

01 行转列:sum+if

在行转列中,经典的解决方案是条件聚合,即sum+if组合。其基本的思路是这样的:

  •  在长表的数据组织结构中,同一uid对应了多行,即每门课程一条记录,对应一组分数,而在宽表中需要将其变成同一uid下仅对应一行
  •  在长表中,仅有一列记录了课程成绩,但在宽表中则每门课作为一列记录成绩
  •  由多行变一行,那么直觉想到的就是要groupby聚合;由一列变多列,那么就涉及到衍生提取;
  •  既然要用groupby聚合,那么就涉及到将多门课的成绩汇总,但现在需要的不是所有成绩汇总,而仍然是各门课的独立成绩,所以需要用一个if函数加以筛选提取;当然,用case when也可以;
  •  在if筛选提取的基础上,针对不同课程设立不同的提取条件,并最终加一个聚合函数提取该列成绩即可。

按照这一思路,一句SQL实现行转列的写法如下: 

SELECT uid,  
      sum(if(course='语文', score, NULL)) as `语文`,  
      sum(if(course='数学', score, NULL)) as `数学`, 
      sum(if(course='英语', score, NULL)) as `英语`,  
      sum(if(course='物理', score, NULL)) as `物理`,  
      sum(if(course='化学', score, NULL)) as `化学`  
FROM scoreLong  
GROUP BY uid 

查询结果当然是预期的行转列后的结果:

其中,if(course='语文', score, NULL)语句实现了当且仅当课程为语文时取值为课程成绩,否则取值为空,这相当于衍生了一个新的列字段,且对于每个uid而言,其所有成绩就只有特定课程的结果非空,其余均为空。这样,无论使用任何聚合函数,都可以得到该uid下指定课程的成绩结果。这里是用了sum函数,其实用min、max效果也是一样的,因为待聚合的数值中就只有那一个值非空。

02 列转行:union

列转行是上述过程的逆过程,所以其思路也比较直观:

  •  行记录由一行变为多行,列字段由多列变为单列;
  •  一行变多行需要复制,列字段由多列变单列相当于是堆积的过程,其实也可以看做是复制;
  •  一行变多行,那么复制的最直观实现当然是使用union,即分别针对每门课程提取一张衍生表,最后将所有课程的衍生表union到一起即可,其中需要注意字段的对齐

按照这一思路,给出SQL实现如下: 

SELECT uid, '语文' as course, `语文` as score  
FROM scoreWide  
WHERE `语文` IS NOT NULL  
UNION  
SELECT uid, '数学' as course, `数学` as score  
FROM scoreWide  
WHERE `数学` IS NOT NULL  
UNION  
SELECT uid, '英语' as course, `英语` as score  
FROM scoreWide  
WHERE `英语` IS NOT NULL   
UNION  
SELECT uid, '物理' as course, `物理` as score  
FROM scoreWide  
WHERE `物理` IS NOT NULL   
UNION  
SELECT uid, '化学' as course, `化学` as score  
FROM scoreWide  
WHERE `化学` IS NOT NULL 

查询结果当然是预期的长表。这里重点解释其中的三个细节:

在每个单门课的衍生表中,例如这句:SELECT uid, '语文' as course, `语文` as score,用单引号包裹起来的课程名称是字符串常量,比如语文课的衍生表中的课程名都叫语文,然后将该列命名为course;第二个用反引号包裹起来的课程名实际上是从宽表中引用这一列的取值,然后将其命名为score。

  •  这实际上对应的一个知识点是:在SQL中字符串的引用用单引号(其实双引号也可以),而列字段名称的引用则是用反引号
  •  上述用到了where条件过滤成绩为空值的记录,这实际是由于在原表中存在有空值的情况,如不加以过滤则在本例中最终查询记录有10条,其中两条记录的成绩字段为空
  •  最后,本例中用union关键字实现了多表的纵向拼接,实际上用union all更为合理,二者的区别是union会完成记录去重;而union all则简单的拼接,在确定不存在重复或无需去重的情况下其效率更高。 
  • 10
    点赞
  • 81
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
行转列是将长表转为宽表的过程,可以使用SQL语句中的SUM IF函数来实现。[1] SUM IF函数可以将符合某个条件的值进行求和,并将结果作为新的列。行转列的思路是将原表中的行记录变为多行,将列字段变为单列。实现的方法是首先根据某个条件进行筛选,然后使用SUM IF函数对符合条件的值进行求和,将结果作为新的列添加到宽表中。 列转行行转列的逆过程,即将宽表转为长表。 在SQL语句中,可以使用UNION操作符将多个查询结果合并为一个结果集。对于列转行的实现,可以针对每个列字段提取一张衍生表,然后使用UNION将所有衍生表合并到一起。需要注意的是字段的对齐,确保每个衍生表中的字段一一对应。 另外,还可以使用GROUP_CONCAT函数来实现列转行。该函数可以将同一组的行合并为一个字段,并返回合并后的结果。分组是根据GROUP BY指定的列进行的,通过指定要返回的列,可以将多个列字段合并为一个字段,实现列转行的效果。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [SQL 行转列列转行](https://blog.csdn.net/qq_52825422/article/details/125612013)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [sql查询:行转列列转行](https://blog.csdn.net/weixin_40482816/article/details/109395069)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值