R中的数据操作
导入数据
myPath = "/my/file/path/"
mydata.hex = h2o.importFile(path = myPath, destination_frame = "mydata.hex")
.hex
文件是R中对H2O中数据的一个引用,类似一个路标,凭此可以在H2O中找到对应的数据去操作。
h2o.uploadFile()
还可以将数据上传到H2O云端。
数据操作
函数名 | 功能 |
---|---|
h2o.anyFactor(mydata.hex) |
判断是否包含因子 |
mydata.hex[,a_column_num]<-as.factor(mydata.hex[,a_column_num]) |
将一列的整行数据转换成无排序的因子 |
mydata.R<-as.data.frame(mydata.hex) |
将H2O数据转换成R的数据框格式,滞后可以用R中函数操作,R处理大量数据的能力不如H2O,所以需要确保转换的数据量R可以承受 |
mydata.hex<-as.h2o(mydata.R,destination_frame="mydata.hex") |
as.data.frame() 的逆过程 |
mydata.hex<-h2o.assign(data=mydata.hex,key = "myNewName") |
重命名,函数将保存新的数据集,对此数据集操作不会影响原来的数据,可以用h2o.ls() 查看key |
colnames/names(mydata.hex) |
显示列名 |