insistere-CSDN博客

原创 hive避免执行mr获取最大分区

因为直接select max(dt) from hiveTab会占用较多资源并且速度很慢，执行show partitions hiveTab然后通过shell可以避免执行mr快速获取最大分区。# 获取分区列表（按时间倒序）# 筛选出最大分区时间。

2023-09-05 11:30:38 269 1

SQL GROUP BY 问题举例：原表字段：A,B,C,aselect t.A as a,t.B as b,MAX(t.C) as cfrom tab_1 tgroup by a问题：聚合字段可以是原表中的字段名称比如 t.A 也可以是sql中select关键字后给字段起的别名比如 a（在多表关联的时候如果有同名的字段不能直接使用原字段名聚合）但是如果起的别名和表中原字段名相同的话（如上例子）会优先使用原表中的a字段聚合而不是 t.A结论：在给字段起

2020-11-02 14:50:04 162

原创给定日期求出其所在周的周一到周日任意一天的日期

今天接到一个需求就是按照周去汇总数据，这个好做。但是时间需要统一给定为周末这要怎么处理呢？下面是朋友给我的一个方法：adddate('1970-01-05',INTERVAL floor(datediff(now_date, '1970-01-05') / 7) * 7 + 6 DAY)求出给定日期距1970-01-05的天数除以7并向下取整获得相对应的周数拿到相距1970-01-05的周数然后乘以7使用adddate函数就可以求出这周一的日期 “+”后面蓝色的数字0~6对应周一到周日.

2020-07-31 10:51:56 334

原创 hive分区表删除指定分区数据

insert overwrite table tablename partition（partition_col=' '）select col1,col2,col3,col4 from tablename where 要保留数据条件;注意：这里不可以写select *

2020-06-03 11:18:36 2136 1

转载 kafka报错 kafka.common.NoReplicaOnlineException: No replica in ISR for partition __consumer_offsets-19

kafka 报错

2020-04-21 16:28:01 1958

原创通过学生表和选课表查询选课数大于三门的学生姓名

student表： course表：查询：选课数大于等于三门的学生姓名1.使用嵌套查询SELECT name from student WHERE id in (SELECT id from course GROUP BY id HAVING COUNT(course)>=3)结果嵌套查询子查询中只能有一列数据并且与主查询中的条件列相同。2.使用连表...

2019-07-13 01:07:01 13860 3

原创一些Java面试题

1.考察String类型的字符串是不可变的 public static class StringTest{ String str = new String("old"); char[] ch = {'a','b','c'}; public static void main(String[] args) { StringTest st = new StringTest();...

2019-07-12 14:49:27 259