
hive的存储格式
hive 高版本的不支持索引了,所以使用 datagrip 的时候,hive.log 中会出现大量的错误。查询性能高,写操作慢,所需内存大,计算量大。此格式为行列混合存储,hive在该格式下,会尽量将附近的行和列的块存储到一起。HQL语句最终会被编译成Hadoop的Mapreduce job,因此hive的压缩设置,实际上就是对底层MR在处理数据时的压缩设置。每一种文件文件格式有一定的压缩比例,但是不是真正的压缩,而是文件格式带来的。hive的压缩使用的是工具压缩,跟存储格式自带压缩不是一回事儿。









