1. 先执行 yum 把 c++ 编译环境相关的组件装好
yum install automake libtool flex bison pkgconfig gcc-c++ boost-devel libevent-devel lib-devel python-devel ruby-devel
2. 按照下面链接的顺序进行rhadoop组件的安装
https://github.com/RevolutionAnalytics/RHadoop/wiki/Installing-RHadoop-on-RHEL
2.1 环境变量在 /etc/profile 中要设置好
HADOOP_CMD HADOOP_STREAMING
3. 注意,from.dfs(mapreduce(to.dfs(1:100))) 有时候会出错
R 运行的工作路径不要是与windows的共享目录,而应该是linux的原生文件夹
4. gmp 安装有坑(
yum install automake libtool flex bison pkgconfig gcc-c++ boost-devel libevent-devel lib-devel python-devel ruby-devel
2. 按照下面链接的顺序进行rhadoop组件的安装
https://github.com/RevolutionAnalytics/RHadoop/wiki/Installing-RHadoop-on-RHEL
2.1 环境变量在 /etc/profile 中要设置好
HADOOP_CMD HADOOP_STREAMING
3. 注意,from.dfs(mapreduce(to.dfs(1:100))) 有时候会出错
R 运行的工作路径不要是与windows的共享目录,而应该是linux的原生文件夹
4. gmp 安装有坑(
configure: error: GNU MP not found, or not 4.1.4 or up, see http://gmplib.org
)
我是把 1 执行完后,自动好的,原因不知
5. 安装 rmr2 rhdfs plyrmr 等组件最好还是有网络
否则,各种依赖的小包装起来完全没尽头