10/27
1.ALS参数调优
10/28
1.研究院开会,制定测试的目标,编写测试的计划报告
2.在研究院的集群运行测试程序(研究院的集群有问题,原因是子节点宕掉)
10/29
1.收集研究院集群的硬件配置,软件配置
2.学习使用cloudera manager来对集群进行监控
3.在spark1.0的环境上跑程序,看看有没有错误
10/30
1.学习CM看机器的在程序运行时的负载
2.查找基于hadoop的决策树模型(mahout 有一个随机森林的模型)
3.运行离网预测的程序,使树的深度高一些