远程服务器拷贝(本地服务器A文件拷贝到远程服务器B):
scp -r ./clean -P 63305 remote_user_name@192.168.**.**:remote_server_path
创建impala数据表
create table company_info(_id varchar(100), _name varchar(100), _scope string) row format delimited fields terminated by '$' ;
将hdfs上的文件Move到Impala数据表的hdfs目录下:
LOAD DATA INPATH "hdfs_source_path" OVERWRITE INTO TABLE company_info ;
注意点:
(1)通过impala-shell创建的表,其owner属于impala,需要保证hdfs上的源数据目录的owner也是impala。
owner更改命令:
sudo -u hdfs hdfs dfs -chown -R impala:supergroup "hdfs_source_path"
(2)impala表导入数据时,导入文件只能是hdfs文件,而且分隔符必须是字符,不能是字符串。(cdh 5.13)
(3)ubuntu上的多个文件打包和压缩为单个rar文件:
rar a target_name.rar name1_* name2.txt