这里写目录标题
1 impala简介
impala是一种新型数据查询系统。能用SQL查询HDFS和HBase中的PB级大数据,相比HIVE,impala最大的特点是快
1.1特点
1:读取hbase和HDFS,hive映射的数据
2.Impala依赖hive,共享元数据,impala的表可以和hive的表同步
3.impala支持窗口函数和自定义函数
4.支持SQL,比Hive快
1.2启动客户端命令
impala-shell
impala-shell --quiet
1.3元数据
在impala建表在hive中可以直接查看,hive会自动读取更新后的元数据,而在hive中建表,impala不会自动更新元数据
impala更新表元数据命令:REFRESH tb_name
更新整个元数据命令:INVALIDATE METADATA
1.4修改权限命令
1.4.1开放hdfs用户超级管理员
vi /etc/passwd
将下面的语句
hdfs:x:996:993:Hadoop HDFS:/var/lib/hadoop-hdfs:/sbin/nologin
改为
hdfs:x:996:993:Hadoop HDFS:/var/lib/hadoop-hdfs:/bin/bash