mysql逗号分隔关键字_MySQL中将一列以逗号分隔的值行转列的实现

前言

有时会遇到没有遵守第一范式设计模式的业务表。即一列中存储了多个属性值。如下表

pk

value

1

ET,AT

2

AT,BT

3

AT,DT

4

DT,CT,AT

一般有这两种常见需求(测试数据见文末)

1.得到所有的不重复的值,如

value

AT

BT

CT

DT

ET

SQL如下:

select distinct(substring_index(substring_index(a.col,',',b.help_topic_id+1),',',-1))

from

(select group_concat(distinct `value`) as col from `row_to_col`) as a

join

mysql.help_topic as b

on b.help_topic_id < (char_length(a.col) - char_length(replace(a.col,',',''))+1)

2.显示每个值及其对应主键,如

pk

value

1

ET

1

AT

2

AT

2

BT

3

AT

3

DT

4

DT

4

CT

4

AT

SQL如下:

select a.pk,substring_index(substring_index(a.col,',',b.help_topic_id+1),',',-1)

from

(select `value` as col,pk from `row_to_col`) as a

join

mysql.help_topic as b

on b.help_topic_id < (char_length(a.col) - char_length(replace(a.col,',',''))+1)

实现思路:

需求1:

1. 通过group_concat函数将value列的值拼接成一个逗号隔开的字符串,然后通过substring_index函数对字符串进行截取

2. 通过substring_index函数特性,我们就需要知道字符串有多少个逗号,并且要告诉每个逗号的位置

3. 逗号个数=char_length(字符串)-char_length(replace(字符串,',',''))

4. 逗号位置=mysql.help_topic.id < 逗号个数[+1]

5. 最后通过distinct函数将截取后的单个值进行去重

注意:

1. mysql.help_topic表的自增id是从0开始,所以在进行截取时要对id进行+1。见: substring_index(a.col,',',b.help_topic_id+1)

2. value列最后一个字符不是逗号时:逗号个数+1是为了截取时不漏掉最后一个逗号后的值,即: char_length(a.col) - char_length(replace(a.col,',',''))+1;

value列最后一个字符是逗号时:逗号个数就不需要+1了,直接:char_length(a.col) - char_length(replace(a.col,',',''))

3. 因为截取时id要+1,所以在连接时取的< ,而不是 <= 。见:b.help_topic_id < (char_length(a.col) - char_length(replace(a.col,',',''))[+1])

4. mysql.help_topic(mysql version: 5.7.21-1)表的自增id,最大值为636。如果group_concat后的字符串中逗号个数大于该值,需要自己单独处理自增id的值

需求2:思路基本与需求1同,只是最后的查询不一样

涉及到的函数:

length:返回字符串所占的字节数,是计算字段的长度。一个汉字或是中文符号是算三个字符,一个数字或字母或英文符号算一个字符。

char_length:返回字符串所占的字符数,不管汉字还是数字或者是字母或者符号(不分中英文)都算是一个字符。

replace(str,old_string,new_string): 将字符串中str中所有的old_string替换成new_string。

substring_index(被截取字段,关键字,关键字出现的次数):截取字符串。如果关键字出现的次数是负数 , 则是从后倒数,到字符串结束。

group_concat([DISTINCT] 要连接的字段(可多个,逗号隔开) [Order BY 排序字段 ASC/DESC] [Separator '分隔符']):

将group by产生的同一个分组中的值连接起来,返回一个字符串结果。分隔符,默认逗号。

测试数据:

DROP TABLE IF EXISTS `row_to_col`;

CREATE TABLE `row_to_col` (

`pk` int(11) NOT NULL AUTO_INCREMENT,

`value` varchar(255) DEFAULT NULL,

PRIMARY KEY (`pk`)

) ENGINE=InnoDB AUTO_INCREMENT=8 DEFAULT CHARSET=utf8;

INSERT INTO `row_to_col` VALUES ('1', 'ET,AT');

INSERT INTO `row_to_col` VALUES ('2', 'AT,BT');

INSERT INTO `row_to_col` VALUES ('3', 'AT,DT');

INSERT INTO `row_to_col` VALUES ('4', 'DT,CT,AT');

参考:

https://blog.csdn.net/liuzhoulong/article/details/51729168

https://blog.csdn.net/ldl22847/article/details/47609727

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值