H2O with R 简明使用手记·上篇

最新推荐文章于 2024-08-12 08:25:33 发布

maybepossible

最新推荐文章于 2024-08-12 08:25:33 发布

阅读量6.5k

点赞数

分类专栏： Machine Learning 文章标签： H2O R 机器学习统计分析

本文链接：https://blog.csdn.net/WL2002200/article/details/51045962

版权

本文介绍了如何使用H2O与R进行机器学习和深度学习，涵盖下载、初始化、数据处理和模型构建等内容。H2O提供多语言接口，支持多种算法，如GLM、DRF、GBM和K均值。文中强调了数据在H2O中的处理方式，以及模型训练和预测的步骤。

摘要由CSDN通过智能技术生成

在看H2O,把阅读官方booklet和API了解到的一些东西随手记了下来，以为备忘，遂成此小文。

概述

library(h2o)
h2o.init(ip = 'localhost', port = 54321, nthreads = -1, max_men_size = '4g')

此ip和port连接了本机的服务器，不填默认也为此。
nthread默认值-2，表示用2个CPU核心，-1表示主机上有多少用多少，正数表示一个特定数。
max_mem_size定义给h2o的内存空间，一般4倍的数据大小能够获得最好的运行效果。它的值必须是1024的整数倍，最小2M，默认值是1g(32bit JAVA版本)，1/4的内存大小(64bit JAVA版本).
对于分布式的系统，可以用h2o.clusterInfo()来查看集群信息。

H2O:"R,你用table秀一下这些信息"
R："臣妾做不到啊……"
//话说我得有多无聊，大晚上编这种段子。。。

圈子不同，偏要强融
- as.data.frame（）H2O->R
- as.h2o() R->H2O
- 一定要记得确保转换的目标具有足够大的内存空间。
- 可以用str.H2OFrame() 查看下其中元素信息确保转换正确。

关注

专栏目录