1.metastore数据库的DBS表
包含各表存储信息等
2.metastore数据库的TBLS表
包含各表是否是外部表等
3.metastore数据库的TABLE_PARAMS表
查看numFiles、numRows
(1)如果是刚建表,numFiles、numRows都为0;
(2)用put上传到Hdfs,numFiles、numRows都不变;元数据没变,count(*)不用走MR;
(3)用insert,走MR,numFiles、numRows都变;select count(*)求的是numRows,count(*)不用走MR;
(4)用load,走MR,其实是将文件上传到Hdfs,比put多一个修改元数据,numFiles更新,但是没有读取文件内容,numRows不变;count(*)要走MR
相比put,用load更好,因为count(*)准确