- 博客(1)
- 收藏
- 关注
原创 kylin新手爬坑体验
之前一直在做一些基于spark&hive统计分析相关的开发工作,大体流程是通过sparkSQL抽取hive中的数据,统计结果回存hive表再使用sqoop实现hive与mysql的数据传递,通过azkaban制定任务流完成完成分析过程,使用这种方式在处理固定维度的分析时没有任何问题,但是当出现维度变化的自查询时就会出现无法正确统计的问题,例如:时间维度变化的uv结果统计。在经过一番调研和尝...
2019-09-01 10:39:31 212
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人