项目从开始准备工作到如今已经接近一个月的时间,这次的中期检查报告回顾一下这一个月内的工作进展,并对未来的进一步工作做一个规划
前期工作总结
1.开发环境搭建
Spark用scala语言进行开发,而Spark本身目前推荐使用YARN作为底层环境,所以我们从最开始三个节点的Spark 1.0.0 on Hadoop1 迁移到现在18个节点的Spark 1.0.1 on YARN,程序的开发IDE一直都是Intellij IDEA Community 13.1,运行环境见下
一次开发工作流程如下:在IDE中修改编写程序,保存之后,进入shell,执行sbt assembly命令,对于assembly的大体积jar包,用官方所提倡的spark-submit命令提交,提交运行命令如下: