Hive的底層跑的是MapReduce,MR需要不斷的在内存以及磁盤中進行數據交換。
壓縮:可以减少磁盘存储空间,降低单节点的磁盘IO。由于压缩后的数据占用的带宽更少,因此可以加快数据在Hadoop集群流动的速度,减少网络传输带宽。但是,需要花费额外的时间/CPU做压缩和解压缩计算。(以時間換空間)
Hive的底層跑的是MapReduce,MR需要不斷的在内存以及磁盤中進行數據交換。
壓縮:可以减少磁盘存储空间,降低单节点的磁盘IO。由于压缩后的数据占用的带宽更少,因此可以加快数据在Hadoop集群流动的速度,减少网络传输带宽。但是,需要花费额外的时间/CPU做压缩和解压缩计算。(以時間換空間)