采用方式:HBase shell命令
hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.separator=',' -Dimporttsv.columns=HBASE_ROW_KEY,info:user_id,info:item_id,info:bahaviour_type,info:user_geohash,info:time 'user_table' ./small_user.csv
注释:
org.apache.hadoop.hbase.mapreduce.ImportTsv:这是运行 HBase 的 ImportTsv 工具的命令。
-Dimporttsv.separator=',':指定 CSV 文件中使用的分隔符为逗号。
_
Dimporttsv.columns=HBASE_ROW_KEY,info:user_id,info:item_id,info:bahaviour_type,info:user_geohash,info:time 指定 CSV 文件中各列数据的映射关系。这里指定了 HBase 表中的列簇和列族。
'user_table':指定导入数据的 HBase 表名。
./small_user.csv:指定要导入的 CSV 文件的路径和文件名。
该命令将从 ./small_user.csv 文件中读取数据,将数据按照指定的列簇和列族导入到 user_table 表中。在导入过程中, 使用逗号作为分隔符,并且将 CSV 文件中的每一列与指定的列簇和列族相对应。