cluster
shuai_wow
这个作者很懒,什么都没留下…
展开
-
OpenMPI报错ORTE_ERROR_LOG: Data unpack had inadequate space
在多节点上运行MPI时可能会遇到以下错误:ORTE_ERROR_LOG: Data unpack had inadequate space这有可能是由于不同节点间的MPI版本(或配置,如有的节点配置了debug模式)不一致导致的。可以使用ompi_info查看具体的版本配置,将不同节点间的配置恢复一致,然后重新安装即可。参考:https://github.com/...原创 2019-11-01 22:14:23 · 1805 阅读 · 0 评论 -
Nexus 搭建docker本地仓库(hosted)和私有仓库(proxy)
本文主要参考“使用 Nexus 搭建 Docker 仓库”,在安装过程中遇到一些问题,本文中一并总结。在此对原作者表示感谢!环境说明:Centos 7.4OpenJDK 8Nexus 3.2.0安装OpenJDK:1 在oracle官网下载安装包:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-21331...原创 2018-03-23 17:02:59 · 2006 阅读 · 0 评论 -
Kubernetes平台配置Tensorflow的GPU集群
注:宿主机操作系统为Centos 7.4安装nvidia驱动:CentOS 7.4 Nvidia显卡安装步骤,Ubuntu 16.04安装见 Ubuntu 16.04 安装Nvidia 驱动:1 在英伟达官网下载相应驱动:http://www.nvidia.com/Download/index.aspx?lang=en-us本文以Centos 7.4系统下为TeslaK40c安...原创 2018-03-22 17:37:16 · 4438 阅读 · 0 评论 -
Kubernetes的alpha.kubernetes.io/nvidia-gpu无法限制GPU个数
问题描述:Pod.yaml文件中关于GPU资源的设置如下:然而在docker中运行GPU程序时,发现宿主机上的两块GPU都在跑。甚至在yaml文件中删除关于GPU的请求,在docker中都可以运行GPU。原因:上例说明alpha.kubernetes.io/nvidia-gpu无效。查看yaml文件,发现该docker开启了特权模式(privileged:ture):而在特权模式下,docker是...原创 2018-03-26 22:37:18 · 1826 阅读 · 0 评论 -
基于RBAC方式从Pod内访问API server
关于Kubernetes中基于角色的访问控制(RBAC)的介绍可以参考文章:Kubernetes RBAC当在物理机上执行kubectl时,会自动根据~/.kube/config文件配置kubectl,其中包含一些权限信息,这样API server就可以根据权限信息决定是否执行来自kubectl的请求。然而在Pod内要想访问API server,更常用的方法是利用service account来验...原创 2018-04-23 22:35:19 · 4609 阅读 · 0 评论 -
MPI与OpenMP 基本使用
MPI注意,MPI是多进程的。1.在程序中加入MPI支持:加入头文件mpi.h,并在程序开头做初始化,退出时,关闭MPI。2.编译:c文件用mpicc编译,c++文件用mpicxx编译。如:$ mpicxx how_to_use_mpi.cpp -o how_to_use_mpi3.运行:mpirun使用mpi运行程序,-n参数指定进程数:$...原创 2019-06-27 15:44:08 · 2179 阅读 · 0 评论 -
OpenMPI安装
下载链接见:https://www.open-mpi.org/software/ompi/v4.0/安装方法详见:https://www.open-mpi.org/faq/?category=building#easy-build$ gunzip -c openmpi-4.0.0.tar.gz | tar xf -$ cd openmpi-4.0.0$ ./configure...原创 2019-01-17 23:12:38 · 23313 阅读 · 0 评论