1、在创建mahout的测试MR工程时,将mahout-core-job.jar放在了hadoop下面,导致hadoop启动之后会全部死掉,至于为何还不清楚
这个问题很奇怪,我将0.9的包放进去便不会死。
我将0.9的包放到测试MR工程,程序也不会报错,现在看来应该是检测到版本的不匹配问题 。
2、TestBuildTree测试mahout的建树,生成的树很奇怪。估计还是数据描述的问题
现在的一个问题是数据描述,dataset究竟是什么样子的不清楚
3、DescribeFollow测试Describe的一个小问题,关于hdfs地址的问题
4、在一个类里可以调用另一个类的main函数
5、myeclipse如何调试
6、myeclipse断点不能用
7、Describe类里的主要操作是runTool()方法,该方法总共做了四件事:
(1)是一个转换,用glass.data来说是将 [ I, 9, N, L ] 转换成 "I N N N N N N N N N L"
(2)验证输出路径是否存在?
(3)返回一个dataset,该dataset有属性,有标识,有样本数
(4)将dataset写入文件
总的来说这个类的主要作用是将原始文件的描述写入一个文件。
8、困惑。BuildForest中runjob究竟做什么?在配置工作之后fansy直接看了Step1Mapper
9、分析Step1Mapper的setup()
10、Step1Mapper的仿制代码需要都文件的包