![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
lanyu_sola
这个作者很懒,什么都没留下…
展开
-
stick-learn朴素贝叶斯的三个常用模型:高斯、多项式、伯努利
stick-learn朴素贝叶斯的三个常用模型:高斯、多项式、伯努利朴素贝叶斯是一个很不错的分类器,在使用朴素贝叶斯分类器划分邮件有关于朴素贝叶斯的简单介绍。若一个样本有n个特征,分别用x1,x2,...,xn表示,将其划分到类yk的可能性P(yk|x1,x2,...,xn)为:P(yk|x1,x2,...,xn)=P(yk)∏ni=1P(xi|yk)上式中等号右侧的各个值可以转载 2017-03-13 13:49:54 · 987 阅读 · 0 评论 -
H2O学习笔记(七)——Deep Water
Deep Water是一个深度学习框架,集成了MXNet, Caffe, TensorFlow,可以实现GPU优化的深度学习模型。目前项目还在开发中。两张图可以描述Deep Water的优点:Deep Water号称最好的深度学习框架,从上面的张图里可以看出,Deep Water集成了mxnet,TensorFlow,Caffe三个框架,这三个框架每个都转载 2017-05-05 13:52:04 · 642 阅读 · 0 评论 -
H2O学习笔记(六)—— Steam
Steam智能引擎是一个端对端的平台,可以将构建和部署智能应用的整个流程结合在一起。数据科学家和开发者可以协同合作,训练和部署预测模型,并将这些模型用于实时的智能应用中。Steam可以运行在YARN上,并可以独立运行,由于我没有Hadoop集群环境,所以这里用单机运行演示。Steam是一个能够将构建和部署应用结合在一起的平台本地机器安装和启动Steam1.安装S转载 2017-05-05 13:49:51 · 754 阅读 · 1 评论 -
H2O的Deep Autoencoders
先前的部分介绍了监督Deep Learning内容,Deep Learning 也可以用作非监督特征学习,尤其是在非线性降维方面。Deep AutoencodersDeep Autoencoders的原理可以看UFLDL的教程例子:Anomaly Detection#Import ECG train and test data into the H2O cluster转载 2017-05-05 13:43:40 · 627 阅读 · 0 评论 -
h2o机器学习算法框架学习总结
H2O官网:http://www.h2o.ai/H2o开源的机器学习框架,支持glm,rf,gbm,深度学习等算法,借助hadoop spark计算平台,实现large scale 机器学习H2o 机器学习包R版本 https://cran.r-project.org/web/packages/h2o/index.htmlPython版本 https转载 2017-05-05 13:41:55 · 5241 阅读 · 0 评论 -
H2O学习笔记(四)——Deep Learning 例子
这里写图片描述##MNIST Digit ClassificationMNIST一个比较出名的数据集,包括60000张训练图片和10000张测试图片,每张图片是一个手写数字,包括282像素值的手写识别数据,扫描的手写数字如下图所示:Example in pythonimport h2ofrom h2o.estimators.deeplearning imp转载 2017-05-05 13:35:58 · 2370 阅读 · 0 评论 -
深度学习中常见的优化算法比较
SGDBasic SGDthe baisc sgd is:# Vanilla updatex += - learning_rate * dxMomentum UpdateMomentum update 是一种几乎总会加快收敛速度的方法. 这种方法据说是物理学中某个理论的启发. 类比SGD, 其中lo转载 2017-05-05 13:29:58 · 2122 阅读 · 0 评论 -
在Mesos和YARN中 DRF算法
背景在Mesos和YARN中,都用到了dominant resource fairness算法(DRF),它不同于hadoop基于slot-based实现的fair scheduler和capacity scheduler,论文阅读: Dominant Resource Fairness: Fair Allocation of Multiple Resource Types 。 考转载 2017-05-05 11:54:37 · 400 阅读 · 0 评论 -
八项提高机器学习模型的准确率的方法
2016-02-14 14:50:59分类: 大数据模型的开发周期有多个不同的阶段,从数据收集开始直到模型建立。不过,在通过探索数据来理解(变量的)关系之前,建议进行假设生成(hypothesis generation)步骤(如果想了解更多有关假设生成的内容,推荐阅读(why-and-when-is-hypothesis-generation-importa转载 2017-05-05 11:52:05 · 393 阅读 · 0 评论 -
H2O学习笔记(二)——H2O Flow
H2O Flow运行深度学习算法demo(一)启动H2Ojava -jar h2o.jar -flow_dir /[ENTER_PATH_TO_FLOW_DIRECTORY_HERE]11-flow_dir 参数是为了指定flow在本地磁盘保存的位置。H2O有两种类型的参数JVM argumentsH2O arguments在浏览器打开http://lo转载 2017-05-05 11:51:27 · 1685 阅读 · 0 评论 -
H2O框架简介(转载)
H2O框架简介H2O是开源的,分布式的,基于内存的,可扩展的机器学习和预测分析框架,适合在企业环境中构建大规模机器学习模型。H2O核心代码使用Java编写,数据和模型通过分布式 Key/Value 存储在各个集群节点的内存中。H2O的算法使用Map/Reduce框架实现,并使用了Java Fork/Join框架来实现多线程。H2O目前支持的机器学习算法有DRF,GBM,GL转载 2017-05-05 09:54:24 · 4945 阅读 · 0 评论 -
word2vec模型原理与实现 word2vec是Google在2013年开源的一款将词表征为实数值向量的高效工具. gensim包提供了word2vec的python接口. word2vec采用
word2vec模型原理与实现word2vec是Google在2013年开源的一款将词表征为实数值向量的高效工具.gensim包提供了word2vec的python接口.word2vec采用了CBOW(Continuous Bag-Of-Words,连续词袋模型)和Skip-Gram两种模型.模型原理语言模型的基本功能是判断一句话是否是自然语言, 从概率的角度来转载 2017-03-13 14:39:02 · 4860 阅读 · 0 评论 -
H2O学习笔记(八)——Sparkling Water
sparkling water将h2o和Spark相结合,在spark平台上运行h2o服务。提供了Scala,Python,R的接口,下面是spark water的一个整体架构图。 安装这里只简单介绍下PySparkling的安装 首先安装Hadoop和Spark,没有问题了再安装Sparkling Water。 PySparkling支持的一些版本h2转载 2017-05-05 13:56:48 · 789 阅读 · 0 评论