hadoop hbase 项目

本文详细介绍了如何在Hadoop-HBase环境下进行bulkloading批量导入数据,包括环境准备、集成HBase到Hadoop、使用importtsv和completebulkload工具进行数据转换与加载,并提供了具体的操作步骤和命令示例。
摘要由CSDN通过智能技术生成

1,bulkloading 批量导入工具

     1.1,环境准备

           1)新建文本数据  music1.txt,music2.txt

                 music1.txt:

                 编号(rowkey)    歌名(song)   歌手(singer)   歌手性别(gender)     节奏 (ryghme)      客户端(terminal)

                 1_song1_2016      song1                 singer1                  man                               slow       ios

                 2_song1_2017      song2                 singer2                  man                               slow       pc

            2)新建表 musicrecored 表(播放记录表)

                 列簇只有一个 info

            3)新建表 namelist 表(歌曲播放统计表)

                 列簇只有一个 details

      1.2,hbase 集成到 hadoop 中(集群每一个节点都需要配置)

            1)将 hbase 核心配置文件 hbase-site.xml 添加到 hadoop主目录/etc/hadoop/下

            2)将 hbase 的库(hbase主目录下lib目录)配置到 hadoop 的环境(hadoop-env.sh)中

                  export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:/home/hduser/hbase-1.2.0/lib/*

            3)利用新建的 musicrecored 表测试集成是否成功

                  在 hbase 主目录/lib/中有 hbase-server***.jar 内有 hbase 提供的工具类 rowcounter 主要用于测试利用 mapreduce 统计 hbase 表中记录总数,命令如下:

                  $>hadoop  jar  hbase主目录/lib/hbase-server*.jar   rowcounter   musicrecord (表名)

       1.3,概念

             bulkloading 批量导入分成两部完成的:

             第一部分将需要导入的文本转化为 HFILE(分布式文件)格式的文件;

             第二部分将 HFILE 文件关联到 hbase 的表

       1

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值