3.1 基本的Select 操作
SELECT [ALL | DISTINCT] 字段名, 字段名, … FROM 表名 [WHERE 条件] [GROUP BY 列名 [HAVING 条件]] [ CLUSTER BY 列名 | [DISTRIBUTE BY 列名] [SORT BY | ORDER BY 列名]][LIMIT 数字]
•使用ALL和DISTINCT选项区分对重复记录的处理。默认是ALL,表示查询所有记录。DISTINCT表示去掉重复的记录
•Where 条件
- 类似我们传统SQL的where 条件
- 目前支持 AND,OR ,0.9版本支持between
- IN, NOT IN
- 不支持EXIST ,NOT EXIST
•ORDER BY与SORT BY的不同
- ORDER BY 全局排序,只有一个Reduce任务
- SORT BY 只在本机做排序
•Limit 可以限制查询的记录数
•REGEX Column Specification
SELECT 语句可以使用正则表达式做列选择,下面的语句查询除了 ds 和 hr 之外的所有列:
SELECT `(ds|hr)?+.+` FROM test