自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (2)
  • 收藏
  • 关注

原创 Oozie 与 Yarn 协同工作

记录一下Oozie针对于Yarn的安装和配置流程。本文Oozie的版本为3.3.2,Hadoop为2.2。

2014-03-17 22:58:01 7895

原创 HBase导出CSV格式数据的方法

本文的测试环境为hbase-0.96.0 + yarn(hadoop-2.0.3-alpha) + pig-0.12.0。在测试前,先创建了一张名为test的hbase表,它内容非常简单,就只有一行数据:HBase export工具导出的数据的格式是sequence file。比如,在执行完命令“bin/hbase org.apache.hadoop.hbase.mapreduce.E

2014-03-16 11:21:43 23291 2

原创 从 Yarn 回滚到 Hadoop 1.x

上一篇博客介绍了如何从Hadoop 1.x升级到Yarn ,而这篇博客将介绍如何从从 Yarn 回滚到 Hadoop 1.x。以下是主要步骤。1、首先,能够回滚的前提是之前upgrade后没有执行过finalizeUpgrade的操作,否则将会导致回滚失败、NameNode不能正常启动:2、设置、启用Hadoop 1.x的环境变量3、更改‘dfs.data.dir’目录的权限

2014-03-16 10:20:08 1139

原创 从Hadoop 1.x升级到Yarn

这里简单记录一下主要步骤。1、停掉所有的Hadoop 1.x进程2、copy Hadoop 2.x项目文件到所有节点上3、设置Hadoop 2.x的环境变量4、编辑Hadoop 2.x的配置文件值得注意的是:需要使用之前版本的HDFS的meta data和 data。因此以下几项需要和之前版本Hadoop的设置一样:a) core-site.xml- hadoop.

2014-03-15 17:25:17 1577

原创 HBase 0.96.0 的数据导入: 利用ImportTsv,completebulkload,Import

记录一下HBase 0.96.0 利用ImportTsv和completebulkload 导入数据的方法。我的环境里用的是Yarn。1、利用ImportTsv 将cvs文件导入到HBase步骤:a. 在hbase里面创建好table: 命令:create 'hbase-tbl-001','cf'b. Upload simple1.cvs文件到hdfs上面,其内容为

2014-03-15 15:23:50 12626 5

原创 使用cygwin 和 scala-eclipse 搭建 Mahout 源代码的开发环境

Open Source的projects很好,不过有些时候难免需要根据自己的需要来更改、重编译Open Source project的源代码。今天搭建了一个Mahout 源代码的Eclipse开发环境。Mahout是用Maven编译的,而且运行在Linux系统上。但我比较习惯在windows上面做开发,所以就基于cygwin搭建了一个Eclipse开发环境。概要步骤如下:1、安装cygwi

2014-03-01 22:02:04 2061

Presto在Uber的使用

介绍Presto在Uber(优步)的应用,使得读者可以对Presto更加了解

2018-11-14

Apache Kudu 介绍

Apache Kudu的介绍slides,帮助读者更进一步了解kudu的技术细节

2018-11-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除