H2O.ai是oxdata公司开发的一款机器学习框架,其目的是打造一款融合了Hadoop、R、BigQuery的超级统计分析工具。h2o包是基于R语言开发的H2O.ai框架,用户可以通过安装h2o包,从而实现以R作为前端数据传输,以H2O作为统计计算的目的,并且利用H2O的高性能,提升建模效率和质量。
当然,出了R语言外,H2O还支持Python、java、Scale等多种借口,目前可以在H2O平台上实现广义线性模型、随机森林、朴素贝叶斯、K-means、GBM、deep learning等算法,另外还支持模型的融合。
h2o包是R语言下调用H2O框架的应用,基于h2o包,用户可以通过R语言的前端接口设定H2O的线程数,再交由JAVA后台实现并行化,多CPU的计算,从而实现R语言的高效计算。
由于H2O是基于JAVA实现的,因此在调用H2O.ai框架时,需要包装计算机上已经安装好了JAVA环境。
对于h2o包的安装,只要利用install.package()函数,即可下载安装cran上面的H2O资源,当然用户也可以下载H2O官方网站上提供的最新安装资源。具体可详见官网:http://www.h2o.ai/download/
本文以MAC系统为例,安装cran上面的h2o包。
install.packages('h2o')</