大数据
ruthy-wei
做好当下,努力未来···
展开
-
详细解释数据挖掘的十大算法
在一份调查问卷中,三个独立专家小组投票选出的十大最有影响力的数据挖掘算法,今天我打算用简单的语言来解释一下。一旦你知道了这些算法是什么、怎么工作、能做什么、在哪里能找到,我希望你能把这篇博文当做一个跳板,学习更多的数据挖掘知识。还等什么?这就开始吧!1.C4.5算法C4.5是做什么的?C4.5 以决策树的形式构建了一个分类器。为了做到这一点,需要给定 C4.转载 2017-09-22 12:07:45 · 4569 阅读 · 0 评论 -
程序员面试、算法研究、编程艺术、红黑树、机器学习5大系列集锦
原文地址:http://blog.csdn.net/v_JULY_v 。前言 开博4年有余,回首这4年,自己的研究兴趣从最初的编程、面试、数据结构、算法,转移到最近的数据挖掘、机器学习之上,而自己在本blog上也着实花费了巨大的时间和精力,写的东西可能也够几本书的内容了。然不管怎样,希望我能真真正正的为读者提供实实在在的价值与帮助。 下面,敬请观赏。有任何问题,欢迎随时转载 2017-11-24 15:45:56 · 439 阅读 · 0 评论 -
Hadoop生态系统
Hadoop生态系统原创 2016年05月24日 20:20:58标签:hadoop/hdfs/MapReduce/Hive/Hbase首先我们先了解一下Hadoop的起源。然后介绍一些关于Hadoop生态系统中的具体工具的使用方法。如:HDFS、MapReduce、Yarn、Zookeeper、Hive、HBase、Oozie、Ma转载 2017-12-28 17:07:37 · 435 阅读 · 1 评论 -
深入理解HBase的系统架构
原文链接:https://blog.csdn.net/Yaokai_AssultMaster/article/details/72877127#hbase%E7%9A%84hmaster初次接触HBase的读者,建议先阅读浅析HBase:为高效的可扩展大规模分布式系统而生HBase的构成物理上来说,HBase是由三种类型的服务器以主从模式构成的。这三种服务器分别是:Region server,HB...转载 2018-04-11 15:17:50 · 344 阅读 · 0 评论 -
hbase运行时ERROR:org.apache.hadoop.hbase.PleaseHoldException:Master is initializing的解决方法
hbase运行时ERROR:org.apache.hadoop.hbase.PleaseHoldException:Master is initializing的解决方法ERROR: org.apache.hadoop.hbase.PleaseHoldException: Master is initializing at org.apache.hadoop.hbase.master.HMa...转载 2018-04-11 19:56:31 · 5203 阅读 · 1 评论 -
Flume架构以及应用介绍
在具体介绍本文内容之前,先给大家看一下Hadoop业务的整体开发流程: 从Hadoop的业务开发流程图中可以看出,在大数据的业务处理过程中,对于数据的采集是十分重要的一步,也是不可避免的一步,从而引出我们本文的主角—Flume。本文将围绕Flume的架构、Flume的应用(日志采集)进行详细的介绍。 (一)Flume架构介绍 1、Flume的概念 flume是分布式的日志收集系统,它将...转载 2018-04-12 20:18:11 · 258 阅读 · 0 评论