H2O with R 简明使用手记·下篇

最新推荐文章于 2024-04-10 11:57:21 发布

maybepossible

最新推荐文章于 2024-04-10 11:57:21 发布

阅读量3.5k

点赞数

分类专栏： Machine Learning 文章标签： H2O 机器学习统计分析 R语言

本文链接：https://blog.csdn.net/WL2002200/article/details/51048886

版权

R中的数据操作

myPath = "/my/file/path/"
mydata.hex = h2o.importFile(path = myPath, destination_frame = "mydata.hex")

.hex 文件是R中对H2O中数据的一个引用，类似一个路标，凭此可以在H2O中找到对应的数据去操作。
h2o.uploadFile() 还可以将数据上传到H2O云端。

函数名	功能
`h2o.anyFactor(mydata.hex)`	判断是否包含因子
`mydata.hex[,a_column_num]<-as.factor(mydata.hex[,a_column_num])`	将一列的整行数据转换成无排序的因子
`mydata.R<-as.data.frame(mydata.hex)`	将H2O数据转换成R的数据框格式，滞后可以用R中函数操作，R处理大量数据的能力不如H2O，所以需要确保转换的数据量R可以承受
`mydata.hex<-as.h2o(mydata.R,destination_frame="mydata.hex")`	`as.data.frame()` 的逆过程
`mydata.hex<-h2o.assign(data=mydata.hex,key = "myNewName")`	重命名，函数将保存新的数据集，对此数据集操作不会影响原来的数据,可以用`h2o.ls()` 查看key
`colnames/names(mydata.hex)`	显示列名

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注