排序:
默认
按更新时间
按访问量

分布式数据集RDD经典集锦

RDD是spark的核心组成,想要理解spark,就必须了解RDD。那么RDD具有什么样的特性,怎么来创建和应用呢?

2017-01-20 10:45:27

阅读数:668

评论数:0

Spark的函数式编程

Spark是近年来发展较快的分布式并行数据处理框架,了解和掌握spark对于学习大数据有着至关重要的意义。但是spark依赖于函数单元,它的函数编程过程是怎样的呢?我们怎么来应用呢?

2017-01-19 15:04:47

阅读数:779

评论数:0

解密数据分区

数据分区分为两种,动态分区和静态分区,那么两种分区是怎样创建的呢?它们各自怎么来使用呢?

2017-01-13 10:21:30

阅读数:1012

评论数:0

在Impala 和Hive里进行数据分区(1)

进行数据分区将会极大的提高数据查询的效率,尤其是对于当下大数据的运用,是一门不可或缺的知识。那么数据怎么创建分区呢?数据怎样加载到分区呢?

2017-01-12 11:06:20

阅读数:1635

评论数:0

Hadoop文件存储的葵花宝典

文件存储分行存储和列存储,每个存储格式里面又分不同的类型,在实际的应用中如何去使用?怎样去使用?快来围观吧!

2016-12-30 13:21:36

阅读数:1581

评论数:0

Hive和Impala加载和存储数据功能曝光

Hive与Impala都是构建在Hadoop之上的数据查询工具,那么在实际的应用中,它们是如何加载和存储数据的呢?

2016-12-28 14:54:23

阅读数:1001

评论数:0

Sqoop新品来了

Sqoop尽管稳定的应用于生产环境很多年,但是它自身存在的一些缺陷给实际操作带来了不便。Sqoop2便成为了研究使用的对象,那么Sqoop2有什么优势呢?

2016-12-26 15:06:51

阅读数:1058

评论数:0

为什么使用Hive和Impala

Impala 与Hive都是构建在Hadoop之上的数据查询工具,但是各有不同侧重,那么我们为什么要同时使用这两个工具呢?单独使用Hive或者Impala不可以吗?

2016-12-20 14:56:49

阅读数:2372

评论数:0

关系型数据库导入导出绝招出炉

Sqoop作为数据传输的工具,对于Hadoop与传统数据库之间数据的传输起着桥梁作用,那么到底如何导入导出数据呢?

2016-12-19 13:31:12

阅读数:1275

评论数:0

Hadoop核心组件:四步通晓HDFS

HDFS作为Hadoop的核心组件,掌握和了解HDFS对于学习Hadoop有着重要的意义,本文通过四个步骤全面阐述HDFS的操作应用,是学习Hadoop人员不得不看的经典分享。

2016-12-16 11:28:15

阅读数:1426

评论数:0

Sqoop导入关系型数据库-解密Sqoop

Sqoop作为Hadoop与传统数据库之间的桥梁,对于数据的导入导出有着重要作用。通过对Sqoop基本语法以及功能的阐述,深刻解密Sqoop的作用和价值。

2016-12-15 13:51:30

阅读数:1218

评论数:0

Hadoop项目规划:硬件

规划硬件我们主要介绍两个方面:一个是Master怎么规划,一个是Slave怎么规划,选择是不一样的。其他规划诸如容量以及操作系统的选择也会简单介绍,对于了解Hadoop的操作环境有着重要帮助作用。

2016-12-13 15:01:14

阅读数:2335

评论数:0

集成Hadoop到数据中心

集成Hadoop到数据中心主要通过有Hadoop的数据中心与没有Hadoop的数据中心之间对比,以及使用Hadoop之后带来的数据流的一些改变等方面进行阐述,对于直观了解Hadoop的应用有着一定作用。

2016-12-12 14:36:37

阅读数:1987

评论数:2

数据分析:Hive、Pig和Impala

主要是针对Hive、Pig和Impala各自的特点、应用、区分,以及与传统数据库的区别来进行阐述,对于深入了解数据分析工具在实际中的运用有着重要作用。

2016-12-09 14:34:11

阅读数:4775

评论数:0

数据集成:Flume和Sqoop

本文主要阐述了Flume和sqoop的功能、架构以及实际应用,中间结合了一些实际的使用例子,读起来更直白易懂,对于了解和学习数据集成的人员来说会有很大作用。

2016-12-08 14:42:32

阅读数:4547

评论数:0

Hadoop数据存储—Hbase

本文主要描述了hbase的特点,hbase与传统数据库的区别,以及为什么我们会使用hbase,主要阐述了个人对于hbase的一些认知和理解。

2016-12-07 15:14:03

阅读数:2571

评论数:0

mapreduce和spark的原理及区别

本文主要根据自己的经验对于mapreduce和spark的原理及区别进行了一个详细的描述,对于了解和学习mapreduce和spark有着一定作用

2016-12-06 15:14:34

阅读数:17433

评论数:0

认识YARN

文章是自己对于YARN的一些见解,主要描述了YARN的特点以及资源分配进程的知识,对于了解和认识YARN有一定的作用。

2016-12-05 16:30:10

阅读数:477

评论数:0

HDFS

文章主要介绍了HDFS这个分布式文件系统与传统文件系统的差异,它在使用中的特点,以及如何存储数据等,对于了解和学习HDFS有着重要作用。

2016-12-02 16:28:59

阅读数:644

评论数:0

hadoop基础概念之Hadoop核心组件

本文通过Hadoop组件,大数据处理,Hadoop核心三个方面层层递进,引出Hadoop和组件作用,对于了解和认知Hadoop具有一定的指导作用。

2016-12-01 15:48:50

阅读数:3481

评论数:0

提示
确定要删除当前文章?
取消 删除