基本命令:
1、 create database 创建数据库
2、Show databases; 显示数据库
3、desc 表明 显示表的详细情况/
4、desc formatted 显示的更详细
5、Drop database 删除
6、select current_database(); 可查看当前在哪个数据库
7、show create table 查看表结构
8、Hdfs dfs -put 文件名 /路劲 把文件上传到hdfs里,
9、load data inpath ‘/user/had/emplhr.txt’ into table emplhr; 加载数据到数据库(sql)
10、show table ‘关键字’ 相当于模糊查询
也可以通过 hdfs dfs -put ‘emp_basic’ /user/hive/warehouse/demo.db/emp_basic上传数据(hdfs)
建立外部表:需要关键字location 外部表可以保护数据,删除表的时候 数据不会被删除
当数据在内部表的时候,是完全由hive管理的,删除表的时候 数据也都会被删除
外部表第一个作用是处理元数据
当我们要做数据的内部转换或者清洗的时候,会建立内部表
共享元数据建立外部表
通过分区(partitions)查找 会提高hive的性能
用year month分区 其实就是文件夹 使用alter table
使用静态partition缺点 每次都要用alter table来增加partition
Hive是不支持动态分区的,需要设定set,默认是不打开的,会有危险性。会创建成千上万个