Hbase数据导入
- 解压数据集
unzip aliyun_webpage.zip (我要解压的包名字叫做aliyun_webpage)
- 把hbase的jar放入hdfs
hdfs dfs -mkdir -p /home/ll/software/hbase-1.2.6/lib/ (在hdfs上创建一个接收文件的文件夹)
hdfs dfs -put /home/ll/software/hbase/lib/ * /home/ll/software/hbase-1.2.6/lib/(将本地路径下的hbase jar放入hdfs自己创建好的文件夹中)
- 创建接收数据的表
在终端hbase shell中输入:create ‘aliyun_webpage’,‘p’,‘f’,‘s’,‘il’,‘ol’,‘h’,‘mtdt’,‘mk’
注:前面的是表名,后面的是列族名
- 数据从hdfs导入到hbase
hbase org.apache.hadoop.hbase.mapreduce.Driver import aliyun_webpage /aliyun_webpage
- 数据也可以直接从linux虚拟机的本地文件导入
hbase org.apache.hadoop.hbase.mapreduce.Driver import aliyun_webpage file:///home/ll/xxxx
- 最后可以进入hbase中用scan 'aliyun_webpage’查看是否导入成功!