- 博客(7)
- 收藏
- 关注
原创 hive避免执行mr获取最大分区
因为直接select max(dt) from hiveTab会占用较多资源并且速度很慢,执行show partitions hiveTab然后通过shell可以避免执行mr快速获取最大分区。# 获取分区列表(按时间倒序)# 筛选出最大分区时间。
2023-09-05 11:30:38
269
1
原创 2020-11-02
SQL GROUP BY 问题举例:原表字段:A,B,C,aselect t.A as a,t.B as b,MAX(t.C) as cfrom tab_1 tgroup by a问题:聚合字段可以是原表中的字段名称 比如 t.A 也可以是sql中select关键字后给字段起的别名 比如 a(在多表关联的时候如果有同名的字段 不能直接使用原字段名聚合)但是如果起的别名和表中原字段名相同的话(如上例子)会优先使用原表中的a字段聚合 而不是 t.A结论:在给字段起
2020-11-02 14:50:04
162
原创 给定日期求出其所在周的周一到周日任意一天的日期
今天接到一个需求就是按照周去汇总数据,这个好做。但是时间需要统一给定为周末这要怎么处理呢?下面是朋友给我的一个方法:adddate('1970-01-05',INTERVAL floor(datediff(now_date, '1970-01-05') / 7) * 7 + 6 DAY)求出给定日期距1970-01-05的天数除以7并向下取整获得相对应的周数 拿到相距1970-01-05的周数然后乘以7使用adddate函数就可以求出这周一的日期 “+”后面蓝色的数字0~6对应周一到周日.
2020-07-31 10:51:56
334
原创 hive分区表删除指定分区数据
insert overwrite table tablename partition(partition_col=' ')select col1,col2,col3,col4 from tablename where 要保留数据条件;注意:这里不可以写select *
2020-06-03 11:18:36
2136
1
转载 kafka报错 kafka.common.NoReplicaOnlineException: No replica in ISR for partition __consumer_offsets-19
kafka 报错
2020-04-21 16:28:01
1958
原创 通过学生表和选课表查询选课数大于三门的学生姓名
student表: course表:查询:选课数大于等于三门的学生姓名1.使用嵌套查询SELECT name from student WHERE id in (SELECT id from course GROUP BY id HAVING COUNT(course)>=3)结果嵌套查询子查询中只能有一列数据并且与主查询中的条件列相同。2.使用连表...
2019-07-13 01:07:01
13860
3
原创 一些Java面试题
1.考察String类型的字符串是不可变的 public static class StringTest{ String str = new String("old"); char[] ch = {'a','b','c'}; public static void main(String[] args) { StringTest st = new StringTest();...
2019-07-12 14:49:27
259
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人