介绍:
H2O是开源的,分布式的,基于内存的,可扩展的机器学习和预测分析框架,适合在企业环境中构建大规模机器学习模型。H2O核心代码使用Java编写,数据和模型通过分布式 Key/Value 存储在各个集群节点的内存中。H2O的算法使用Map/Reduce框架实现,并使用了Java Fork/Join框架来实现多线程。
相关资源:
github:https://github.com/h2oai/h2o-3
测试数据下载地址:http://data.h2o.ai/
首次接触指导文档:https://github.com/h2oai/h2o-3/blob/master/h2o-docs/src/product/flow/README.md
H2O的产品:
H2O Flow:开源的分布式的机器学习框架,可以通过web页面快速构建模型;
Deep Water:自动化机器学习框架,后端支持TensorFlow、MXNet以及Caffe.
Sparkling Water:可扩展的H2O的机器学习算法与Spark的功能相结合。 使用Sparkling Water,用户可以从Scala / R / Python驱动计算,并利用H2O Flow UI,为应用程序开发人员提供了理想的机器学习平台。
Stream:实时机器学习智能应用解决方案;
Driverless AI:无人驾驶技术平台;
学习说明:
首先通过指导文档对页面布局有一定的了解,稍后可以通过用例自己创建一个模型来验证;
机器学习的参数调整和设置仍需要专业知识;
前台页面的不足:图表不够直观,中文资料较少,存在一定的入门门槛;