转自:http://blog.sina.com.cn/s/blog_4dfbf1c60100yyon.html
网格计算和SGE
从概念上讲,网格很简单。它是执行任务的计算资源的集合。对用户而言,它就是一个大系统,提供单个切入点,以访问强大而分散的资源。用户将网格视作单个计算资源。资源管理软件(如Sun Grid Engine)接受由用户提交的作业,并根据资源管理策略将作业安排在网格内适当的系统上执行。用户可以一次提交数千个作业,而不必考虑它们在何处运行。
什么是Cluster grids?
网格的类型:Cluster grids , campus grids and global grids.
集群网格(cluster grids)包括许多计算资源,SGE帮助我们将这些一起工作的资源合理地提供给一个项目或一个部门的用户。
SGE的工作原理
Sun Grid Engine 软件为用户提供了向Sun Grid Engine 系统提交要求计算的任务的方法,以透明地分配相关的工作负荷。用户可以向Sun Grid Engine 系统提交批处理作业、交互式作业和并行作业。
Sun Grid Engine用以下方式调解可用资源和作业需求。
通过Sun Grid Engine 系统提交作业的用户描述出作业需求的概况。此外,系统还要检索用户的身份以及他或她与项目或用户组的从属关系。用户提交作业的时间也将存储起来。
准确地说,在队列被定为可以对新作业执行操作的那一刻, Sun Grid Engine 系统就决定了适合该队列的作业,并立即分派具有最高优先级或等待时间最长久的作业。
Sun Grid Engine 队列允许同时执行许多作业。Sun Grid Engine 系统将尽量在负荷最小且最适合的队列中开始新的作业。
为什么用SGE?
用户:用户能够自由地在单一的控制节点上投放上千个的任务,而不必关心任务在哪个节点运行,这样就大大简化了用户的使用。
管理员:提供广泛的工具,用以监控投放的任务。
集群任务管理系统SGE
最新推荐文章于 2022-11-28 12:13:14 发布