不喜哥哥

认识的海洋越大,无知的海岸线越长

排序:
默认
按更新时间
按访问量

用于实时大数据处理的Lambda架构

用于实时大数据处理的Lambda架构 原文地址:https://blog.csdn.net/brucesea/article/details/45937875 1.Lambda架构背景介绍 Lambda架构是由Storm的作者Nathan Marz提出的一个实时大数据处理框架。Marz在Tw...

2018-10-10 10:52:29

阅读数:9

评论数:0

hbase数据库详解

本文首先简单介绍了HBase,然后重点讲述了HBase的高并发和实时处理数据 、HBase数据模型、HBase物理存储、HBase系统架构,HBase调优、HBase Shell访问等。 不过在此之前,你可以先了解 Hadoop生态系统 ,若想运行HBase,则需要先搭建好Hadoop集群环境,...

2018-08-10 13:52:30

阅读数:134

评论数:0

Docker安装以及原理详解

Docker docker简介 1.1虚拟化 1.1.1什么是虚拟化 在计算机中,虚拟化(英语:Virtualization)是一种资源管理技术,是将计算机的各种实体资源,如服务器、网络、内存及存储等,予以抽象、转换后呈现出来,打破实体结构间的不可切割的障碍,使用户可以比原本的组态更好的方式...

2018-07-17 14:14:06

阅读数:57

评论数:0

linux系统下安装oracle详解

本文档采用centos 6.x下静默安装Oracle 11g R2硬件要求:物理内存不少于1G硬盘可用空间不少于5Gswap分区空间不少于2G一.设置系统(root用户下) #vi /etc/redhat-release//操作系统,系统只支持Red Hat Enterprise Linux 6,...

2018-07-13 15:55:46

阅读数:37

评论数:0

Sqoop导入导出

Sqoop 导入“导入工具”导入单个表从 RDBMS 到 HDFS。表中的每一行被视为 HDFS 的记录。所有记录都存储为文本文件的文本数据(或者 Avro、sequence 文件等二进制数据)。下面的语法用于将数据导入 HDFS。$ sqoop import (generic-args) (im...

2018-07-11 16:31:20

阅读数:44

评论数:0

ElasticSearch简单入门案例

1、原生操作使用 Xput创建索引说明:RESTful接口URL的格式:http://localhost:9200/<index>/<type>/[<id>]其中in...

2018-07-11 16:27:32

阅读数:54

评论数:0

ambari2.6.2安装详解

一、环境准备1、准备三台机器centos6.5Server:node-1(192.168.80.137)Agent:node-2(192.168.80.138),node-3(192.168.80.139)注:以下操作如无特殊说明,均需在3台机器上进行 2、设置FQDN修改/etc/hosts文件...

2018-07-10 17:44:19

阅读数:231

评论数:0

Oozie4.3.1安装指南详解

一、环境支持Oozie4.3.1Centos 6.5Java JDK 1.8Maven 3.5.4Hadoop2.7.4Pig0.17二、安装步骤详解Java的安装1、解压安装包tar -zxvf jdk-8u73-linux-x64.gz -C /export/service2、配置环境变量vi...

2018-07-09 19:44:16

阅读数:222

评论数:0

Hadoop2.7.4安装部署详解

Hadoop集群安装文档一.安装步骤1 . 发行版本Hadoop 发行版本分为开源社区版和商业版,社区版是指由 Apache 软件基金会维护的版本,是官方维护的版本体系。商业版 Hadoop 是指由第三方商业公司在社区版 Hadoop 基础上进行了一些修改、整合以及各个服务组件兼容性测试而发行的版...

2018-07-09 15:36:11

阅读数:51

评论数:0

Hive整合Hbase详解

Hive 整合Hbase1、摘要Hive提供了与HBase的集成,使得能够在HBase表上使用HQL语句进行查询 插入操作以及进行Join和Union等复杂查询、同时也可以将hive表中的数据映射到Hbase中。 2、应用场景2.1 将ETL操作的数据存入HBase  2.2 HBase作为Hiv...

2018-07-09 14:08:54

阅读数:43

评论数:0

ELK(ElasticSearch,Logstash,Kibana)入门详解

麋鹿ELK由ElasticSearch,Logstash和Kiabana三个开源工具组成。一,ELK概述1 ,ELK 简介ElasticSearch:是个开源分布式搜索引擎,它的特点有:分布式,零配置,自动发现,索引自动分片,索引副本机制, restful风格接口,多数据源,自动搜索负载等。Log...

2018-07-09 13:21:13

阅读数:91

评论数:0

Hadoop3.0集群详细搭建步骤

一、搭建Hadoop3.X1.1配置服务器1个主节点:centos100(192.168.65.128),2个(从)子节点:centos101(192.168.65.129),centos102(192.168.65.130)1.2配置主节点名(192.168.65.128)vi /etc/sys...

2018-07-09 13:12:57

阅读数:96

评论数:0

Impala的简单入门

一、Impala概述什么是Impala?Impala是用于处理存储在Hadoop集群中的大量数据的MPP(大规模并行处理)SQL查询引擎。 它是一个用C ++和Java编写的开源软件。 与其他Hadoop的SQL引擎相比,它提供了高性能和低延迟。换句话说,Impala是性能最高的SQL引擎(提供类...

2018-07-06 16:51:23

阅读数:739

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭