目录
1.1 为什么要用hadoop
一些数据集的大小远远超过1TB,数据的存储是一个要解决的问题。同时硬盘技术也面临一个技术瓶颈,就是硬盘的传输速度(读数据的速度)的提升远远低于硬盘容量额提升
扩展知识:数据大小单位,从小到大分别是:tybe、kb、mb、Gb、Tb、PB、EB、ZB、DB、NB........单位之间的转换都是满足1024
Hadoop为我们提供了一个可靠的且可扩展的存储和分析平台,此外由于Hadoop运行在商用的硬件上且是开源的,因此Hadoop的使用成本是比较低的,在用户的承受范围内。