hadoop
z_Dc
这个作者很懒,什么都没留下…
展开
-
Pig在MapReduce下的实例
前提:安装的是完全分布式的Hadoop,启动hadoop,然后启动Pig 根据Hadoop权威指南实例实现计算每年的最高温度。 1、第一步,创建temperature.txt的文档记录每年的温度 2、将temperature.txt文件放到HDFS 文件上去,具体操作如下: 3、输入pig,进入shell编辑模式下。 4、查看temperature是否在in的目录转载 2017-02-28 15:32:32 · 1247 阅读 · 0 评论 -
HBase理解
1 基本介绍 1.1 前言 HBase – Hadoop Database,是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能转载 2017-03-02 16:45:10 · 477 阅读 · 0 评论 -
hbase ImportTsv导入数据文件方法
记录一下Hbase 0.96.0 利用ImportTsv,completebulkload 和Import导入数据的方法。我的环境里用的是Yarn。 1、利用ImportTsv 将cvs文件导入到HBase 步骤: a. 在hbase里面创建好table: 命令:create 'hbase-tbl-001','cf' b. Upload simple1.cvs文件到hd转载 2017-03-31 13:51:11 · 2496 阅读 · 0 评论