impala有两种刷新方式:invalidate metadata和refresh
1.两种刷新方式区别:
invalidate metadata
是用于刷新全库或者某个表的元数据,包括表的元数据和表内的文件数据,它会首先清除表的缓存,然后从metastore中重新加载全部数据并缓存,该操作代价比较重。 refresh
只是刷新某个表或者某个分区的数据信息,它会重用之前的表元数据,仅仅执行文件刷新操作,它能够检测到表中分区的增加和减少,主要用于表中元数据未修改,数据的修改。
2.刷新表的操作/命令
1 invalidate metadata 刷新整个库和表
2 invalidate metadata table 刷新指定表
3 refresh table 刷新表
4 refresh table partition(xxx) 刷新表分区
5 ps:刷新表分区的时候必须要写全,比如有二级分区就需要写二级分区,一级分区会报错,例如refresh test.table11 partition(year = 2022, month = 11)
3.注意点
invalidate metadata操作比refresh要重量级
如果涉及到表的schema改变,使用invalidate metadata table
如果只是涉及到表的数据改变,使用refresh table
如果只是涉及到表的某一个分区数据改变,使用refresh table partition(partition)
禁止使用invalidate metadata什么都不加,宁愿重启catalogd(数据量级大,不建议)。