如果我们想做一个数据分析项目,我们就应该清楚数据的处理流程。
我们大致可以分为:
数据采集——数据存储——数据清洗——数据分析——数据可视化和数据挖掘、二次分析
在以上流程处理完成之后,会进入调度阶段:将数据采集、清洗、分析、导出、可视化制作成一个 调度任务,一键就可运行所有阶段。所用技术:azkaban技术
如果我们想做一个数据分析项目,我们就应该清楚数据的处理流程。
我们大致可以分为:
数据采集——数据存储——数据清洗——数据分析——数据可视化和数据挖掘、二次分析
在以上流程处理完成之后,会进入调度阶段:将数据采集、清洗、分析、导出、可视化制作成一个 调度任务,一键就可运行所有阶段。所用技术:azkaban技术