问题解答
什么是计算?
什么是分布式计算?
为什么非要分布式计算呢,非分布式不行吗?
分布式(数据)计算如何组织、协调?
什么是(数据)计算
我们一直在提及:分布式计算, 分布式暂且不论, “计算”到底是指什么呢?
大数据体系内的计算, 举例:
销售额统计、区域销售占比、季度销售占比 利润率走势、客单价走势、成本走势 品类分析、消费者分析、店铺分析 等等一系列,基于数据得出的结论。
这些就是我们所说的计算。也就是说它是广义上的。
什么是分布式计算
分布式计算:顾名思义,即以分布式的形式完成数据的统计,得到需要的结果。
为什么非要分布式计算呢,非分布式不行吗
数据太大,一台计算机无法独立处理
靠数量来取胜
分布式(数据)计算如何组织、协调
两种模式介绍
分散->汇总模式
分散->汇总模式:
1. 将数据分片,多台服务器各自负责一部分数据处理
2. 然后将各自的结果,进行汇总处理
3. 最终得到想要的计算结果
生活中的“人口普查” 就是典型的分散汇总的分布式统计模式
中心调度->步骤执行模式
中心调度->步骤执行模式:
1. 由一个节点作为中心调度管理者
2. 将任务划分为几个具体步骤
3. 管理者安排每个机器执行任务
4. 最终得到结果数据
生活中的各类项目的:项目经理 和 项目成员 就是这种模式,一个管理分配任务,其余人员领取任务工作