- ·扩展性差。在MRv1中,jobtracker同时兼备了资源管理器和作业控制两个功能。这成为系统的一大瓶颈,严重制约着hadoop集群的发展。
- 可靠性差。在MRv1中,采用master/slave结构,master存在单点问题,一但单点出现故障,整个集群将不可用。
- 资源利用率低。MRv1采用基于槽位的资源分配模型,槽位是一种粗粒度的资源划分单位,通常一个任务不会用完槽位对应的资源,而且其他资源也无法使用槽位空闲的资源。此外,槽位分为map slot和reduce slot,而且不允许它们之间共享,会造成一种槽位资源紧张而另外一种闲置,例如job刚提交时,只运行map task,而reduce slot闲置。
- 无法支持多种计算框架。随着互联网高速发展,mapreduce这种基于硬盘的离线计算框架已经不能满足应用要求,从而出现了新的计算框架:内存计算框架(spark)、流式计算框架(s4)、迭代式计算框架(storm)等,而MRv1不支持多种计算框架并存。
Hadoop1 MRv1中的局限性
最新推荐文章于 2020-10-15 12:17:41 发布