ENABLE|DISABLE NOVALIDATE RELY/NORELY
启用约束:
enable novalidate :启用约束,创建索引,仅对新加入的数据强制执行约束,而不管表中的现有数据.
禁用约束:
disable novalidate:关闭约束,删除索引,可以对约束列的数据进行修改等操作.
Hive包含对未经验证的主键和外键约束的支持,一些sql工具在存在约束时会生成更加高效的查询,由于这些限制条件未经验证,上游系统在加载到Hive之前需要确保数据的完整性。
常用的PK( PRIMARY KEY)和FK(FOREIGN KEY)约束使用如下:
CREATE TABLE product
(
product_id INTEGER,
product_vendor_id INTEGER,
PRIMARY KEY (product_id) DISABLE NOVALIDATE,
CONSTRAINT product_fk_1 FOREIGN KEY (product_vendor_id) REFERENCES vendor(vendor_id) DISABLE NOVALIDATE
);
CREATE TABLE vendor
(
vendor_id INTEGER,
PRIMARY KEY (vendor_id) DISABLE NOVALIDATE RELY
);
create table pk(id1 integer, id2 integer,
primary key(id1, id2) disable novalidate);
在上面的语法中,需要注意一下几点:
[CONSTRAINT constraint-Name]是可选的,定义一个约束名称,若是没有指定系统会生成一个约束名称,为简单起见,CONSTRAINT在外键时可以使用,因为每个表只有一个主键因此没有必要定义约束名称。
RELY/NORELY同样是可选的。如果一个约束指定RELY,也就是希望HIVE CBO(cost based optimize)使用约束信息来获得更好的统计,对不必要的连接删除( join
elimination),来得到更好的整体执行计划。
DISABLE 和NOVALIDATE现在是强制性的因为现在暂不支持默认的ENABLE 和VALIDATE,实际上就是上边介绍的hive未验证约束。
一个表只允许有一个主键约束。
正常来说外键的引用必须是唯一性索引,也就是unique或者主键,但是hive目前并不支持unique,因此目前外键的父列必须是主键。
添加约束
ALTER TABLE table_name ADD CONSTRAINT constraint_name PRIMARY KEY (column, ...) DISABLE NOVALIDATE;
ALTER TABLE table_name ADD CONSTRAINT constraint_name FOREIGN KEY (column, ...) REFERENCES table_name(column, ...) DISABLE NOVALIDATE RELY;
ALTER TABLE table_name ADD CONSTRAINT constraint_name UNIQUE (column, ...) DISABLE NOVALIDATE;
ALTER TABLE table_name CHANGE COLUMN column_name column_name data_type CONSTRAINT constraint_name NOT NULL ENABLE;
ALTER TABLE table_name CHANGE COLUMN column_name column_name data_type CONSTRAINT constraint_name DEFAULT default_value ENABLE;
ALTER TABLE table_name CHANGE COLUMN column_name column_name data_type CONSTRAINT constraint_name CHECK check_expression ENABLE;
ALTER TABLE table_name DROP CONSTRAINT constraint_name;