- 博客(3)
- 收藏
- 关注
原创 机器学习算法一览
机器学习算法一览图 一般说来,机器学习有三种算法:1. 监督式学习监督式学习算法包括一个目标变量(因变量)和用来预测目标变量的预测变量(自变量)。通过这些变量我们可以搭建一个模型,从而对于一个已知的预测变量值,我们可以得到对应的目标变量值。重复训练这个模型,直到它能在训练数据集上达到预定的准确度。属于监督式学习的算法有:回归模型,决策树,随机森林,K邻近算法,逻辑回归等。...
2018-07-06 15:34:26 696
转载 Spark 以及 spark streaming 核心原理及实践(二)
spark 生态及运行原理Spark 特点 运行速度快 => Spark拥有DAG执行引擎,支持在内存中对数据进行迭代计算。官方提供的数据表明,如果数据由磁盘读取,速度是Hadoop MapReduce的10倍以上,如果数据从内存中读取,速度可以高达100多倍。 适用场景广泛 => 大数据分析统计,实时数据处理,图计算及机器学习 易用性 =>...
2018-07-05 10:54:39 1183
转载 深入理解Hbase架构
HBase的构成物理上来说,HBase是由三种类型的服务器以主从模式构成的。这三种服务器分别是:Region server,HBase HMaster,ZooKeeper。其中Region server负责数据的读写服务。用户通过沟通Region server来实现对数据的访问。HBase HMaster负责Region的分配及数据库的创建和删除等操作。ZooKeeper作为HDFS的一部分,负责...
2018-07-04 11:48:07 1660 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人