Hadoop
文章平均质量分 69
碧茂大数据
传递自我技术经验,温暖更多求知人群
展开
-
集成Hadoop到数据中心
集成Hadoop到数据中心主要通过有Hadoop的数据中心与没有Hadoop的数据中心之间对比,以及使用Hadoop之后带来的数据流的一些改变等方面进行阐述,对于直观了解Hadoop的应用有着一定作用。原创 2016-12-12 14:36:37 · 3637 阅读 · 2 评论 -
Sqoop导入关系型数据库-解密Sqoop
Sqoop作为Hadoop与传统数据库之间的桥梁,对于数据的导入导出有着重要作用。通过对Sqoop基本语法以及功能的阐述,深刻解密Sqoop的作用和价值。原创 2016-12-15 13:51:30 · 1743 阅读 · 0 评论 -
关系型数据库导入导出绝招出炉
Sqoop作为数据传输的工具,对于Hadoop与传统数据库之间数据的传输起着桥梁作用,那么到底如何导入导出数据呢?原创 2016-12-19 13:31:12 · 1779 阅读 · 0 评论 -
Sqoop新品来了
Sqoop尽管稳定的应用于生产环境很多年,但是它自身存在的一些缺陷给实际操作带来了不便。Sqoop2便成为了研究使用的对象,那么Sqoop2有什么优势呢?原创 2016-12-26 15:06:51 · 1245 阅读 · 0 评论 -
Hive和Impala加载和存储数据功能曝光
Hive与Impala都是构建在Hadoop之上的数据查询工具,那么在实际的应用中,它们是如何加载和存储数据的呢?原创 2016-12-28 14:54:23 · 1323 阅读 · 0 评论 -
Hadoop文件存储的葵花宝典
文件存储分行存储和列存储,每个存储格式里面又分不同的类型,在实际的应用中如何去使用?怎样去使用?快来围观吧!原创 2016-12-30 13:21:36 · 1884 阅读 · 0 评论 -
为什么使用Hive和Impala
Impala 与Hive都是构建在Hadoop之上的数据查询工具,但是各有不同侧重,那么我们为什么要同时使用这两个工具呢?单独使用Hive或者Impala不可以吗?原创 2016-12-20 14:56:49 · 3938 阅读 · 0 评论 -
在Impala 和Hive里进行数据分区(1)
进行数据分区将会极大的提高数据查询的效率,尤其是对于当下大数据的运用,是一门不可或缺的知识。那么数据怎么创建分区呢?数据怎样加载到分区呢?原创 2017-01-12 11:06:20 · 3468 阅读 · 0 评论 -
解密数据分区
数据分区分为两种,动态分区和静态分区,那么两种分区是怎样创建的呢?它们各自怎么来使用呢?原创 2017-01-13 10:21:30 · 1537 阅读 · 0 评论 -
Spark的函数式编程
Spark是近年来发展较快的分布式并行数据处理框架,了解和掌握spark对于学习大数据有着至关重要的意义。但是spark依赖于函数单元,它的函数编程过程是怎样的呢?我们怎么来应用呢?原创 2017-01-19 15:04:47 · 1702 阅读 · 0 评论 -
Hadoop核心组件:四步通晓HDFS
HDFS作为Hadoop的核心组件,掌握和了解HDFS对于学习Hadoop有着重要的意义,本文通过四个步骤全面阐述HDFS的操作应用,是学习Hadoop人员不得不看的经典分享。原创 2016-12-16 11:28:15 · 1798 阅读 · 0 评论 -
数据分析:Hive、Pig和Impala
主要是针对Hive、Pig和Impala各自的特点、应用、区分,以及与传统数据库的区别来进行阐述,对于深入了解数据分析工具在实际中的运用有着重要作用。原创 2016-12-09 14:34:11 · 7935 阅读 · 0 评论 -
认识YARN
文章是自己对于YARN的一些见解,主要描述了YARN的特点以及资源分配进程的知识,对于了解和认识YARN有一定的作用。原创 2016-12-05 16:30:10 · 658 阅读 · 0 评论 -
HDFS
文章主要介绍了HDFS这个分布式文件系统与传统文件系统的差异,它在使用中的特点,以及如何存储数据等,对于了解和学习HDFS有着重要作用。原创 2016-12-02 16:28:59 · 1018 阅读 · 0 评论 -
hadoop基础概念之Hadoop核心组件
本文通过Hadoop组件,大数据处理,Hadoop核心三个方面层层递进,引出Hadoop和组件作用,对于了解和认知Hadoop具有一定的指导作用。原创 2016-12-01 15:48:50 · 10679 阅读 · 0 评论 -
Hadoop产生原因
本文从大规模传统系统的问题引出Hadoop,介绍了Hadoop的自身优势和适用背景,内容详实原创 2016-11-29 14:59:30 · 2748 阅读 · 2 评论 -
初识Apache Hadoop
Apache Hadoop从概念,事实,使用,供应商集成,发行版等各个方面描述了Hadoop的基本知识,对于大家了解和认知Hadoop意义重大原创 2016-11-28 14:47:57 · 995 阅读 · 0 评论 -
零基础学习 Hadoop 如何下手
文章从虚拟化、Linux、Java三个方面详细介绍了hadoop的学习过程原创 2016-11-24 16:00:29 · 1904 阅读 · 3 评论 -
Hadoop项目规划:硬件
规划硬件我们主要介绍两个方面:一个是Master怎么规划,一个是Slave怎么规划,选择是不一样的。其他规划诸如容量以及操作系统的选择也会简单介绍,对于了解Hadoop的操作环境有着重要帮助作用。原创 2016-12-13 15:01:14 · 4122 阅读 · 0 评论 -
Hadoop数据存储—Hbase
本文主要描述了hbase的特点,hbase与传统数据库的区别,以及为什么我们会使用hbase,主要阐述了个人对于hbase的一些认知和理解。原创 2016-12-07 15:14:03 · 3654 阅读 · 0 评论 -
数据集成:Flume和Sqoop
本文主要阐述了Flume和sqoop的功能、架构以及实际应用,中间结合了一些实际的使用例子,读起来更直白易懂,对于了解和学习数据集成的人员来说会有很大作用。原创 2016-12-08 14:42:32 · 11506 阅读 · 0 评论 -
分布式数据集RDD经典集锦
RDD是spark的核心组成,想要理解spark,就必须了解RDD。那么RDD具有什么样的特性,怎么来创建和应用呢?原创 2017-01-20 10:45:27 · 1063 阅读 · 0 评论