- 博客(3)
- 收藏
- 关注
原创 rook使用教程,快速编排ceph
kubernetes集群三步安装安装git clone https://github.com/rook/rookcd cluster/examples/kubernetes/cephkubectl create -f operator.yaml 查看operator是否成功:[root@dev-86-201 ~]# kubectl get pod -n rook-ceph-sy...
2019-01-23 19:33:16 1760
原创 深度学习批任务处理调度器与kubernetes默认调度器融合
kubernetes集群三步安装什么是批处理任务深度学习中经常会出现多机多卡的任务,也就是同事会起多个pod,但是这多个pod属于同一个任务。这样就会有一个问题一个任务要起100个pod,每个pod需要一张卡,总共需要100张GPU卡,而集群中只有99张空闲的GPU卡,这样默认的k8s调度器会如何处理?因为默认调度器是一个一个pod调度的,只会检查单个pod资源够不够,这样前99个都...
2019-01-03 16:51:37 721
原创 使用prometheus operator监控envoy
kubernetes集群三步安装概述prometheus operator应当是使用监控系统的最佳实践了,首先它一键构建整个监控系统,通过一些无侵入的手段去配置如监控数据源等故障自动恢复,高可用的告警等。。不过对于新手使用上还是有一丢丢小门槛,本文就结合如何给envoy做监控这个例子来分享使用prometheus operator的正确姿势至于如何写告警规则,如何配置prometheus...
2019-01-03 16:43:19 868
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人