自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

守得云开见月明

系统技术链 QQ:598691918

  • 博客(4)
  • 收藏
  • 关注

原创 大数据平台搭建(四):hive中的表及UDF

前言      本章介绍hive内部表、外部表、分区表和UDF等。1.hive表介绍    1.Hive虽说是数据仓库,其实可以认为就是一个mysql数据库,hive中的表名对应的是hdfs上的文件目录名,表内容就是对应目录下的文件。    2.hive表的hdfs路径     在hive-site.xml中,由参数hive.metastore.wareh...

2018-04-13 21:07:17 2135

原创 大数据平台搭建(三):hive 介绍和安装配置

前言      集群我们已经弄好了,本章开始搭建hive。1.hive介绍    1.Hive是什么?     官方解释:Hive是基于Hadoop的数据仓库解决方案。由于Hadoop本身在数据存储和计算方面有很好的可扩展性和高容错性,因此使用Hive构建的数据仓库也秉承了这些特性。     简单来说,Hive就是在Hadoop上架了一层SQL接口,可以将...

2018-04-13 17:18:38 2046

原创 大数据平台搭建(二):hadoop HA 集群搭建

前言      本章搭建zookeeper集群和hadoop集群1.hadoop版本的选择    1.目前而言,不收费的Hadoop版本主要有三个(均是国外厂商),分别是:Apache(最原始的版本,所有发行版均基于这个版本进行改进)、Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称CDH)、Hor...

2018-04-11 17:52:21 2758 1

原创 大数据平台搭建(一):虚拟机环境配置

前言      最近看了些hadoop相关的资料,然后想自己从零开始搭建一个大数据平台。大数据平台架构    1.概念性的东西还是不想多啰嗦,先上一张网上找的平台架构图,上图的目的是为了大家对整个平台架构有个宏观的认识,这个很重要,如果盲目的零碎的去研究效果很差。    2.目标当然是整合图中所有框架和组件,但是时间可能有限,机器也有限(本机搭建)。所以,我...

2018-04-10 17:25:22 7576 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除