把表中某字段根据分隔符拆分成N个字符串后,再用这N个字符串把这一行演变成N行。
用SQL来解决这个问题非常烦琐!
SQL里没有提供集合对象,不能提供根据拆分后的字符串集合把一行变成多行的操作。解决这个问题的思路就是先求出字段拆分后的最大字符串个数M,然后构造一个M行1列的临时表T2,其列名为lv,则各行lv值分别为1,2,……,M,然后用原表与之叉乘,叉乘时取字段拆分后的第T2.lv个字符串。这样写出来的SQL是多个子查询嵌套而成,其语法是比较复杂的。而且各种数据库中拆分字符串的函数并不统一,所以SQL的写法也各不相同。
举个例子:现有学生选修课数据表COURSES数据如下,要求查出每个学生选修了几门课:
COURSE | STUDENTS |
Chinese | Tom,Kate,John,Jimmy |
Russia | Tom,Cart,Jimmy |
Spanish | Kate,Joan,Cart |
Portuguese | John,Tom |
History | Tom,Cart,Kate |
Music | Kate,Joan,Tom |
要求输出结果如下:
STUDENT | NUM |
Tom | 5 |
Kate | 4 |
Cart | 3 |
Jimmy | 2 |
Joan | 2 |
John | 2 |
以Oracle为例,用SQL写出来是这样:
SELECT STUDENT, COUNT(*) NUM FROM
(SELECT T1.COURSE, REGEXP_SUBSTR(T1.STUDENTS, '[^,]+', 1, T2.LV ) STUDENT
FROM COURSES T1,
( SELECT LEVEL LV
FROM (SELECT MAX(REGEXP_COUNT(A.STUDENTS, '[^,]+', 1)) R_COUNT
FROM COURSES A
) B
CONNECT BY LEVEL <= B.R_COUNT) T2
WHERE REGEXP_SUBSTR(T1.STUDENTS, '[^,]+', 1, T2.LV) IS NOT NULL
) C
GROUP BY STUDENT
ORDER BY NUM DESC;
这里的C就是前文提到的那个临时表,可见这个SQL层次很多,可读性比较差,不易读懂。
如果用集算器的SPL语言来解决这个问题,就会简单很多,只需1行代码:
connect("mydb").query("SELECT * FROM COURSES").news(STUDENTS.split@c();~:STUDENT).groups(STUDENT;count(1):NUM).sort(-NUM)
SPL语言有集合对象,并提供了根据集合把一行扩展成多行的功能,所以写起来思路清晰明了,简便易懂,并且语法统一,不论数据来自哪种数据库还是来自文件型数据源,写法都是一样的。
SPL 集合还提供了交、差、并运算,聚合运算,循环遍历运算,请阅《SPL教案 集合》
SPL也能很方便地嵌入到JAVA应用,可参考《Java 如何调用 SPL 脚本》。
具体使用方法可参考 《如何使用集算器》。