hadoop视磁盘IO 和网络带宽开销为瓶颈,再此前提下,所有有关减少磁盘IO开销 和网络带宽开销的 都视为集群调优可选项。 可选项包括: 软件层面(系统软件和集群软件),硬件层面,网络层面。 能不使用磁盘IO和网络就不使用,在必须使用的情况下,能少用则少用