[置顶] kubernetes1.7发布跟踪--1.7部分新特性介绍

Kubernetes发布历史回顾    Kubernetes 1.0 - 2015年7月发布    Kubernetes 1.1 - 2015年11月发布    Kubernetes 1.2 - 2016年3月发布    Kubernetes 1.3 - 2016年7月发布    Kubernetes 1.4 - 2016年9月发布    Kubernetes 1.5 - 2016年12月发布  ...
阅读(10364) 评论(0)

Kubernetes1.6新特性:POD高级调度-污点和容忍特性/报告节点问题特性

(一)  核心概念Pod是kubernetes中的核心概念,kubernetes对于Pod的管理也就是对Pod生命周期的管理以及对Pod进行调度管理。Kubernetes早期版本使用系统默认调度器来对Pod进行统一调度管理,在1.2版本中增加了多个调度器特性,多个调度器可以并行调度不同的Pod,并且可以允许用户自己定义新的调度器并以插件的方式供kubernetes使用。在1.6版本中对POD调度进...
阅读(10856) 评论(0)

Kubernetes1.6新特性:POD高级调度-亲和性/反亲和性特性

(一)  核心概念Pod是kubernetes中的核心概念,kubernetes对于Pod的管理也就是对Pod生命周期的管理以及对Pod进行调度管理。Kubernetes早期版本使用系统默认调度器来对Pod进行统一调度管理,在1.2版本中增加了多个调度器特性,多个调度器可以并行调度不同的Pod,并且可以允许用户自己定义新的调度器并以插件的方式供kubernetes使用。在1.6版本中对POD调度进...
阅读(12044) 评论(0)

Kubernetes1.6新特性:POD高级调度-POD调度器配置变化

(一)  核心概念Pod是kubernetes中的核心概念,kubernetes对于Pod的管理也就是对Pod生命周期的管理以及对Pod进行调度管理。Kubernetes早期版本使用系统默认调度器来对Pod进行统一调度管理,在1.2版本中增加了多个调度器特性,多个调度器可以并行调度不同的Pod,并且可以允许用户自己定义新的调度器并以插件的方式供kubernetes使用。在1.6版本中对POD调度进...
阅读(12494) 评论(0)

Kubernetes1.7发布跟踪

Kubernetes发布历史回顾    Kubernetes 1.0 - 2015年7月发布    Kubernetes 1.1 - 2015年11月发布    Kubernetes 1.2 - 2016年3月发布    Kubernetes 1.3 - 2016年7月发布    Kubernetes 1.4 - 2016年9月发布    Kubernetes 1.5 - 2016年12月发布  ...
阅读(10525) 评论(2)

分布式深度学习的两种集群管理与调度的实现方式简介

为什么需要集群管理与调度上文我们简单介绍了深度学习、分布式CPU+GPU集群的实现原理,以及分布式深度学习的原理,我们简单回顾一下:分布式CPU+GPU集群的实现:GPU集群并行模式即为多GPU并行中各种并行模式的扩展,如上图所示。节点间采用InfiniBand通信,节点间的GPU通过RMDA通信,节点内多GPU之间采用基于infiniband的通信。分布深度学习框架的实现:如下图所示,在tens...
阅读(15698) 评论(0)

分布式机器学习的集群方案介绍之HPC实现

机器学习的基本概念机器学习方法是计算机利用已有的数据(经验),得出了某种模型(迟到的规律),并利用此模型预测未来(是否迟到)的一种方法。目前机器学习广泛应用于广告投放、趋势预测、图像识别、语音识别、自动驾驶和产品推荐等众多领域。在确定了问题模型之后,根据已知数据寻找模型参数的过程就是训练,训练过程就是不断依据训练数据来调整参数的迭代,从而使依据模型作出的预测结果更加准确。HPC的基本概念HPC就是...
阅读(30431) 评论(2)

深度学习简介,GPU计算的原理,分布式机器学习原理

深度学习简介深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习采用的模型为深层神经网络(Deep Neural Networks,DNN)模型,即包含多个隐藏层(Hidden Layer,也称隐含层)的神经网络(Neural Networks,NN)。深度学习利用模型中的...
阅读(10485) 评论(0)

如何基于K8S打造轻量级PaaS平台

4月23日天云软件技术开放日已圆满落幕,接下来几天将陆续放出沙龙期间技术大牛们的干货分享现场实录及相关文件,敬请关注。此文为第2篇,由天云软件CTO牛继宾给大家带来名为“如何基于K8S打造轻量级PaaS平台”的精彩分享,以下为演讲实录。牛继宾:大家下午好,我从几个角度介绍一下PaaS平台。我们把天云软件基于K8S与Docker构建轻量级平台叫做ECP,就是弹性计算平台。我们知道刚才马俊讲的CMP,...
阅读(15630) 评论(0)

企业级云管理平台的架构实现与落地实践、趋势分析

4月23日天云软件技术开放日已圆满落幕,接下来几天将陆续放出沙龙期间技术大牛们的干货分享现场实录及相关文件,敬请关注。此文为第一篇,由天云软件产品总监马俊带来的IaaS专题:企业级云管理平台的架构实现与落地实践、趋势分析,以下为演讲实录。马俊:我给大家介绍一下云管平台,OpenStack现在比较流行,企业级客户IT架构在OpenStack上会有一个云管的平台,整个业界对云系统建设也都是怎么认识的。...
阅读(16943) 评论(2)

Kubernetes1.6新特性:全面支持多颗GPU

(一)  背景资料 GPU就是图形处理器,是Graphics Processing Unit的缩写。电脑显示器上显示的图像,在显示在显示器上之前,要经过一些列处理,这个过程有个专有的名词叫“渲染" ,以前计算机上是没有GPU的,都是通过CPU来进行“渲染”处理的,这些涉及到“渲染”的计算工作非常耗时,占用了CPU的大部分时间。之后出现了GPU,是专门为了实现“渲染”这种计算工作的,用来将CPU解...
阅读(14914) 评论(0)

kubernetes1.6新特性:支持新的卷插件

背景介绍 在Kubernetes中卷的作用在于提供给POD持久化存储,这些持久化存储可以挂载到POD中的容器上,进而给容器提供持久化存储。 从图中可以看到结构体PodSpec有个属性是Volumes,通过这个Volumes属性可以关联到结构体Volume和结构体VolumeSource,而且这个Volumes属性是一个数组类型,就是说POD可以关联到多个不同类型的卷上面。 结构体...
阅读(11849) 评论(0)

在100,000个核心集群上运行100万个作业

随着客户在更大的环境中部署OpenLava。可扩展性,吞吐量和性能变得越来越重要。为了满足这些领域的客户需求,OpenLava 提供了一些重要的增强功能: o  并行化作业事件处理以加速集群启动并最小化停机时间。 o   增强的守护进程间通信,提高效率和性能。 o   其他调整参数,为集群管理员提供其他工具,以提高性能,响应速度和可扩展性。 在发布OpenLava之前,天云软件使用HPC ...
阅读(15626) 评论(0)

Kubernetes1.6本周正式发布

Kubernetes发布历史回顾     Kubernetes 1.0 - 2015年7月发布     Kubernetes 1.1 - 2015年11月发布     Kubernetes 1.2 - 2016年3月发布     Kubernetes 1.3 - 2016年7月发布     Kubernetes 1.4 - 2016年9月发布     Kub...
阅读(19165) 评论(0)

使用OpenLava运行MPI作业

介绍 OpenLava是一个开源的,IBM Platform LSF工作量兼容管理器,可以安排串行和并行作业。MPI(消息传递接口)是高性能计算(HPC)应用中广泛使用的编程接口,用于并行化大规模问题的执行。有多个常用的MPI实现。本文档介绍如何使用OpenLava运行MPI应用程序。 大多数MPI实现支持与常用工作负载管理器的集成。在大多数情况下,这些集成使用工作负载管理器特定的远程任务启动...
阅读(13224) 评论(0)
124条 共9页1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:1613473次
    • 积分:11678
    • 等级:
    • 排名:第1183名
    • 原创:70篇
    • 转载:53篇
    • 译文:1篇
    • 评论:51条
    文章分类
    最新评论