要安装SparkR,首先需要安装好hadoop和Spark,这个安装前面两篇已经引用了详细的教程。
值得注意的是,jdk也要确保安装正确,并且有一个默认的版本(如果安装过多个不同版本的jdk),可以通过sudo update-alternatives --config java进行查看和设置。
本文只针对Ubuntu,其他的系统不一定有用。下面通过走过的弯路和具体的安装步骤进行一下记录。
1.安装R
1.1 在source list中添加镜像源
<< sudo vim /etc/apt/sources.list
在该文件中添加新的镜像源,加入文件的最前或者最后:
deb http://cran.rstudio.com/bin/linux/ubuntu trusty/
1.2 运行命令下载公钥
sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys 51716619E084DAB9
然后需要更新:
sudo apt-get update
1.3 安装R
sudo apt-get install r-base
2. 安装Rstudio
2.1 下载系统安装文件
下载地址为:http://www.rstudio.com/products/rstudio/download/
然后执行:
sudo apt-get install gdebi-core
sudo apt-get install libapparmor1
sudo gdebi 刚才下载的Rstudio的deb安装包
2.2 在Rstudio中安装ggplot2等相关的包
install.packages('plyr