参数设置
1.set hive.cli.print.current.db=true可以上CLI显示当前的数据库名称;
2.可以用like 配合正则表达式查询相应条件的数据库名。show database like 'hji.*';//显示以hji开头的数据库
3.用create database创建数据库的时候会在hive.metastore.warehouse.dir相应的目录下创建相应数据库命名的文件夹,下面存储表
(default数据库除外,没有default.db命名的文件夹存在)
4.用关键字comment可以添加描述信息。
5.hive不允许用户删除一个有表的数据库的,要删除可以再后面添加cascade。如:drop database financial cascade;
(如果某个数据库被删除了其相应的文件夹也会被删除)
6.修改数据库
alter database financial set dbproperties('edited-by'='hadoop');
7.在创建表时,如果当前所在的数据库并非目标数据库可以用create table 数据库名.tablename创建。可以用comment为每个字段添加解释信息。
8.用户还可以拷贝一张已经存在的表,create [external] table if not exists 数据库名.student1 like 数据库名.student;
9.创建表时可以partition指定分区情况,如:
create table student(id int,name string,class string,provice string)partition by (class string,provice string);
查询时可以用select * from student where class='....' anf provice='hebei';
对于非常大的数据集,分区可以显著地提高查询性能。