Excle导入集群
1)将Excle文件转换成txt文件,注意转换前后的编码方式。通常使用utf-8
2)将转换后的txt文件导入集群。并根据txt文件中的字段创建Hive表
3)加载数据到hive中。load data inpath '/user/test.txt' into table ads_test;
时间字段相减取天数
由于公司数据中时间的格式是yyyy/M/dd,其中月份有取值在(1~12)。主要业务是求出当前时间和入职时间的差值
1)将数据库中的时间按着‘/’切分。split('/',join_time)
2)将切分后的时间利用concat函数组合起来concat(split('/',join_time)[0],'-',split('/',join_time)[1],'-',split('/',join_time)[2])
3)用datediff函数传递当前时间和上面求出来的时间进行相减。datediff(current_date,concat(split('/',join_time)[0],'-',split('/',join_time)[1],'-',split('/',join_time)[2]))得出天数
大家有更好的思路,欢迎前辈指点