- 博客(9)
- 资源 (4)
- 收藏
- 关注
翻译 sparklyr包:Spark Machine Learning
sparklyr绑定了Spark分布式机器学习库。而且,sparklyr允许访问spark.ml包中提供的机器学习程序。加上sparklyr的dplyr接口,完全可以通过R精心策划,在spark中轻松创建和调整机器学习的工作流程。
2016-08-19 18:18:51 1642
翻译 sparklyr包:dplyr包在Spark中的用法
简介dplyr是一个R包,用来处理R环境内外的结构化数据。dplyr使得R语言使用者更简单、一致、高效地处理数据。使用dplyr包处理spark数据集,功能包括:Select, filter, and aggregate 数据可以使用窗口函数(如sample)多个数据集进行join将spark数据集加载到R内存中 在dplyr语句中可以使用magrittr包中定义的管道连接
2016-08-19 17:16:42 2796
原创 安装sparklyr包过程中遇到的几个ERROR
日前,Rstudio公司发布了sparklyr包。该包具有以下几个功能:实现R与Spark的连接—sparklyr包提供了一个完整的dplyr后端筛选并聚合Spark数据集,接着在R中实现分析与可视化利用Spark的MLlib机器学习库在R中实现分布式机器学习算法可以创建一个扩展,用于调用Spark API。并为Spark的所有包集提供了一个接口未来在RStudio IDE中集成支持Spa
2016-08-12 19:17:28 2821
原创 Rstudio多个版本R语言环境进行选择
当遇到安装的某个包与机器上的R语言版本不一致时,往往我们需要升级R语言,但是升级后又面临另一个问题,有的包可能在新版本没有完善,这个时候就需要旧版本的R,所以往往我们会在机器上安装多个版本的R环境,至少安装一个最新版,一个版本低一点。 在Rstudio中可以选择R的版本进行运行:
2016-08-12 15:29:51 18602 3
原创 R语言版本升级
使用R时,经常会遇到,在某个版本的R中安装一个包时出现:Warning messages:1: 程辑包‘rJava’是用R版本3.2.3 来建造的 这造成包的版本与所使用的R版本不匹配,要对R版本进行升级。
2016-08-12 14:35:57 6516
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人