在数据分析业务中经常要处理数据文件。我们知道,对于数据库中的数据,使用SQL来查询是非常方便快捷的,所以很容易想到把文件数据先导入到数据库再用SQL来查询。但是文件数据导入数据库本身也是很繁琐的工作,那么有没有直接对数据文件使用SQL查询的办法呢?本文将介绍这样的办法,列举出用 SQL 查询文件数据的各种情况,并提供用 esProc SPL 编写的代码示例。esProc 是专业的数据计算引擎,SPL 中提供了完善的用 SQL 查询文件数据的方法。
本文用文本文件举例,但同时也适用于Excel文件。
1. 过滤
使用SQL从文本文件中筛选满足条件的记录。
示例:从学生成绩表Students_scores.txt中筛选出10班的学生成绩,文件中第一行是列名,第二行开始是数据,如下图所示。
A | |
1 | $select * from E:/txt/Students_scores.txt where |
2. 汇总
使用SQL对文本文件中的数据进行汇总。
示例:计算学生成绩表中全体学生的语文平均分、数学最高分、英语总分。
A | |
1 | $select avg(Chinese),max(Math),sum(English) from E:/txt/Students_scores.txt |
3. 跨列计算
使用SQL对文本文件中的数据进行跨列计算。
示例:计算学生成绩表中每位学生的总分。
A | |
1 | $select *,English+Chinese+Math as total_score from E:/txt/students_scores.txt |
A1中结果如下,增加了一个新的计算列total_score:
4. CASE语句
在SQL中可以使用CASE语句进行复杂条