大数据
文章平均质量分 90
hadoop、spark、hive等大数据学习知识
不是祸津神的夜斗
一名在校大学生
展开
-
Hive基本操作--2018安徽省大数据竞赛赛题2(hive数据清洗)
2018安徽省大数据竞赛hive操作解析总结原创 2022-08-08 12:00:27 · 679 阅读 · 0 评论 -
相邻两行差值的求解与连续天数求解 --hive大数据分析
这里题目要求的是按照降序排序后,求出当前一名与下一名的种植树的数量的差值。涉及到order by 排序,表的连接等还有一些比如将浮点数按照下取整的方式转化为整形等细节操作。为了减少思维的复杂性,我建立了临时表,且建立了不止一个,以使得每一次写的sql语句没有那么长。这一问有难度但也不是特别难,其考察的还是一个简单的表连接问题,我一直想着使用窗口函数,导致思路有些偏了,然后卡了好久,思路还是要灵活一些,不能总想着用一行代码就给写完。原创 2022-10-06 09:41:05 · 977 阅读 · 1 评论