1、建表
CREATE TABLE tableName(
......)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n'
2、从本地 / hdfs 导入数据
# local
load data local inpath '本地文件路径' into table tableName
# hdfs
local data inpath 'hdfs路径(不需要携带hdfs://ip:9000,直接文件地址即可)' into table tableName
3、分割字段
# index 为分割的括号位置
# 例如 0 为 ([0-9])+ 对应12
# 例如 1 为 (月) 对应月
# 例如 2 为 ([0-9])+ 对应31
select regexp_extract('12月31','([0-9])+(月)([0-9])+',index)
4、row_number() over()函数
# 分每个班查询成绩排名
select s_name,score,row_number() over(partition by class_id order by socre) from sc;