HIve 创建内部表时,会将数据移动到数据仓库指定的路径;创建外部表,仅记录数据所在的路径,不对数据的位置做任何改变。
在删除表时,内部表的元数据和数据会被一起删除,而外部表只删除元数据,不删数据。
Hive中的读时模式与rdbm的写实模式:读时模式,只有在读取数据的时候hive才检查、解析具体的数据字段、schema,它的优势是load data 非常迅速,因为它不需要读取数据进行解析,仅仅进行文件的复制或者移动。
写时模式,的优势是提升了查询性能,因为预先解析之后可以对列建立索引,并压缩,但会花费更多的加载时间。