Openstack 项目Sahara,主要是用来搭建Hadoop集群,利用虚拟出来的计算资源,快速搭建Hadoop集群。
Sahara项目与OPenstack其他项目的关系:
图片转自:http://docs.openstack.org/developer/sahara/overview.html
Sahara有两种基本使用流程:
1、快速布署,用户可以增加减少Hadoop节点,,,,
2、分析即服务,根据用户设定的模板创建Hadoop集群,跟计算,然后干掉集群,之后把结果放在(比如Swift容器中)
Sahara 架构包含几个组件:
- Cluster Configuration Manager - 集群配置管理器,这里所有的业务逻辑驻留
- Auth component - 身份验证组件,负责客户端身份验证和授权
- DAL - Data Access Layer, 数据访问层,持续在数据库内部模型
- VM Provisioning - 负责与Nova、Glance组件沟通
- Deployment Engine -Hadoop部署引擎,可插入机制,负责部署配置vm,现有管理解决方案
- REST API - 通过REST提供Sahara功能
- Python Sahara Client -类似于其他OpenStack组件都有自己的Python Client
- Sahara pages - Horizon上面的GUI
内容来自:http://docs.openstack.org/developer/sahara/architecture.html
转眼23点,简单介绍,周末继续深入。
Openstack的这个项目,基本能自动化布署Hadoop集群,搞Hadoop的小伙伴再也不用那么麻烦去布多结点了。需要就开个集群,用完就干掉,这种快捷,应该是Openstack的优势,看好这个项目,继续关注。