- 博客(3)
- 收藏
- 关注
原创 用python在hadoop上运行wordcount
1. gedit wordcount_mapper.py gedit wordcount_reducer.py 2. chmod 775 wordcount_mapper.py chmod 775 wordcount_reducer.py 3.上传测试文件到HDFS hadoop fs -put testfile1 input/py hadoop fs -put t
2015-12-14 16:07:24 1126
原创 spark+python学习笔记感想
上周终于把coursera上的一门数据课程结束了,并且通过了,周四根据课程assignment做的实验印象很深,觉得有必要记下来。 Hadoop Platform and Application Framework by University of California, San Diego https://www.coursera.org/learn/hadoop/home
2015-12-14 16:06:26 1736
原创 hadoop+mahout 建立决策树实验的问题
12/3 今天再战决策树,用的还是KDDTrain数据集 然后今天实验感觉快成功了, 首先这是这样的 1. hadoop jar mahout-examples-0.7-job.jar org.apache.mahout.classifier.df.mapreduce.BuildForest -Dmapred.max.split.size=1874231 -d dttest/inp
2015-12-03 15:30:15 786
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人