大数据框架
boombaya
学习&记录
展开
-
Hive编程指南-要点总结(1)
1. 当对3个或更多的表进行join连接时,若是on子句都是使用相同的连接键的话,那么只会产生一个mapreduce任务。2. 用户在进行多表查询时,需要保证连续查询的表的大小从左至右是依次增大的。因为Hive假定查询中最后一个表是最大的表,在对每行记录进行连接操作时,它会尝试将其他表缓存起来,然后扫描最后那个大表进行计算。3. map-side join:使用Broadcast实现ma...原创 2019-04-08 13:59:50 · 382 阅读 · 0 评论 -
Hive SQL Date时间处理
1.FROM_UNIXTIME( bigint number_of_seconds [, string format] )将unix时间戳转为系统当前时区的时间格式,时间格式默认为'yyyy-MM-dd HH:mm:ss',可自定义。SELECT FROM_UNIXTIME(UNIX_TIMESTAMP()) #2019-04-09 11:12:02SELECT FROM_UN...原创 2019-04-09 14:04:44 · 4513 阅读 · 0 评论