- 在目录下/home/ipms/huang/msisdn.csv 有csv文件msisdn.csv
内容格式如下:
2.1查看hdfs上的目录:hdfs dfs -ls /
2.2在hdfs的/tmp目录下建立一个目录
2.2.1建立目录之前:
2.2.2建立目录之后:(命令:hdfs dfs -mkdir /tmp/msisdn_csv)
2.3将本地文件系统的数据上传到hdfs上:
2.4修改文件权限,设置为可读写:hdfs dfs -chmod 777 /tmp/msisdn_csv/msisdn.csv
3.输入命令impala-shell 进入到impala客户端界面,进行建表操作。
3.1 建立外部表ext_msisdn:运行命令:location 的位置需要指定hdfs中的目录。
drop table if exists ext_msisdncsv;
create external table ext_msisdncsv
(
msisdn string,
tt string
)
row format delimited fields terminated by ','
location '/tmp/msisdn_csv/';
location 的位置需要指定hdfs中的目录。
3.1.1通过show databases查看有哪些数据库,(可以自己建立一个数据库,超出与mysql类似)通过使用use ipms 选择使用哪一个数据库。
通过show tables查看当前数据库下表,看是否存在建成的表;
3.2建立内部表inner_msisdncsv:
drop table if exists inner_msisdncsv;
create table inner_msisdncsv
( msisdn string ,
tt string
)row format delimited fields terminated by ','; (同上一步)
3.2.2 通过select * from ext_msisdncsv; 查看是否有数据。
3.3把外部表中数据导入到内部表中
insert overwrite table inner_msisdn
select * from ext_msisdn ;
结束。
如果想进一步加深了解学习,参考连接:http://my.oschina.net/weiqingbin/blog/186337