前文回顾:HDFS分布式文件系统
目录
📚对付大数据处理:分而治之
🐇大数据的并行化计算
不可分拆的计算任务或相互间有依赖关系的数据无法进行并行计算。
一个大数据若可以分为具有同样计算过程的数据块,并且这些数据块之间不存在数据依赖关系,则提高处理速度的最好办法就是并行计算。
前文回顾:HDFS分布式文件系统
目录
不可分拆的计算任务或相互间有依赖关系的数据无法进行并行计算。
一个大数据若可以分为具有同样计算过程的数据块,并且这些数据块之间不存在数据依赖关系,则提高处理速度的最好办法就是并行计算。