微软机器学习平台openpai搭建教程(dev-box)

6 篇文章 0 订阅
2 篇文章 0 订阅

基本需求和配置:

     系统: ubuntu16.04

     内存:64G

     硬盘:40G

环境准备

   

IP系统软件kubernetes角色
 192.168.78.130ubuntu16.04.3docker18.09.5,私有仓库node
192.168.78.131ubuntu16.04.3docker18.09.5master
192.168.78.132ubuntu16.04.3docker18.09.5node
192.168.78.133ubuntu16.04.3docker18.09.5node
192.168.78.134ubuntu16.04.3docker18.09.5node

创建openpai用户 

    新建用户

adduser openpai
passwd openpai
chmod u+w /etc/sudoers

    给kube用户赋sudo权限

vim  /etc/sudoers  添加kube用户
openpai    ALL=(ALL)       NOPASSWD: ALL
chmod u-w /etc/sudoers

 

安装docker     

       服务器没有网络,我将安装包及依赖下载下来之后上传至服务器,所需镜像都拉去下来,然后在也上传到服务器上

       打包镜像

sudo docker save -o pylon.tar openpai/pylon:v0.14.0  # 以pylon镜像为例

       加载镜像

sudo docker load -i pylon.tar

       这里搭建了私有仓库,我们将镜像都上传至私有镜像仓库

sudo docker tag openpai/pylon:v0.14.0 192.168.78.130:5000/openpai/pylon:v0.14.0
sudo docker push 192.168.78.130:5000/openpai/pylon:v0.14.0

      修改docker配置

# vim /etc/docker/daemon.json
 
{
  "data-root": "/data/docker",                       # 修改docker存储路径
  "log-opts": {
       "max-size": "100m", "max-file": "10"
   }, 
  "log-driver": "json-file", 
  "insecure-registries": ["192.168.78.130:5000"]     # 改为私有镜像仓库,
} 

       重启docker

sudo systemctl restart docker

运行dev-box

       拉取镜像dev-box

sudo docker pull 192.168.78.130:5000/openpai/dev-box:v0.14.0

      运行dev-box容器

sudo docker run -itd -e COLUMNS=$COLUMNS -e LINES=$LINES -e TERM=$TERM -v /var/run/docker.sock:/var/run/docker.sock -v /pathConfiguration:/cluster-configuration  -v /hadoop-binary:/hadoop-binary  --pid=host --privileged=true --net=host --name=dev-box  192.168.78.130:5000/openpai/dev-box:v0.14.0

      进入容器

sudo docker exec -it dev-box /bin/bash

配置k8s

      配置quick-start.yaml文件

cd /pai  
cp deployment/quick-start/quick-start-example.yaml deployment/quick-start/quick-start.yaml
vim deployment/quick-start/quick-start.yaml


machines:
  - 192.168.78.131         # 第一台机器为k8s的master
  - 192.168.78.130
  - 192.168.78.132
  - 192.168.78.133
  - 192.168.78.134


ssh-username: openpai
ssh-password: openpai-123

     修改kubernetes-configuration.yaml.template

vim deployment/quick-start/kubernetes-configuration.yaml.template


kubernetes:
  # 服务器要配置dns /etc/resolv.conf,否则安装不成功
  cluster-dns: {{ env["dns"] }}
  load-balance-ip: {{ env["load-balance-ip"] }}
  service-cluster-ip-range: {{ env["service-cluster-ip-range"] }}
  storage-backend: etcd3
  #  设置私有镜像仓库
  docker-registry: 192.168.78.130:5000
  # http://gcr.io/google_containers/hyperkube. Or the tag in your registry.
  hyperkube-version: v1.9.9
  # http://gcr.io/google_containers/etcd. Or the tag in your registry.
  # If you are not familiar with etcd, please don't change it.
  etcd-version: 3.2.17
  # http://gcr.io/google_containers/kube-apiserver. Or the tag in your registry.
  apiserver-version: v1.9.9
  # http://gcr.io/google_containers/kube-scheduler. Or the tag in your registry.
  kube-scheduler-version: v1.9.9
  # http://gcr.io/google_containers/kube-controller-manager
  kube-controller-manager-version:  v1.9.9
  # http://gcr.io/google_containers/kubernetes-dashboard-amd64
  dashboard-version: v1.8.3
  #   修改etcd安装目录
  etcd-data-path: "/data/etcd"

      修改services-configuration.yaml.template

vim deployment/quick-start/services-configuration.yaml.template


cluster:
  docker-registry:
    namespace: openpai
    domain: 192.168.78.130:5000          # 设置私有仓库
    # 设置openpai版本,openpai的dev-box镜像有点坑,镜像版本是v0.14.0,但是里边的代码是
    # v0.13.0,启动该镜像时会通过git校验版本并更新代码,所以离线环境中运行之前一定要在
    # 有网络的环境中运行dev-box容器后在打包上传至服务器
    tag: v0.14.0                         
    secret-name: pai-secret
rest-server:
  # webui登录用户名
  default-pai-admin-username: admin
  # webui登录密码
  default-pai-admin-password: admin-password

       生成配置文件

python paictl.py config generate -i /pai/deployment/quick-start/quick-start.yaml -o ~/pai-config -f

启动K8S

      启动k8s

python paictl.py cluster k8s-bootup -p ~/pai-config

     启动结束之后访问 http://192.168.78.131:9090, 如果可以正常访问,那就证明没有什么问题

启动openpai

     创建cluster-id

python paictl.py config push -p ~/pai-config -c ~/.kube/config

    在命令行中输入:pai ,然后回车,这是可以在k8s管理界面查看是否创建成功http://192.168.78.131:9090/#!/configmap/default/pai-cluster-id?namespace=default,结果如下图

    部署openpai

python paictl.py service start -c ~/.kube/config

    这个操作要等待很长时间,中间出现类似“xxxxxxx  is not ready yet. Please wait for a moment!” 这样的提示可以多等待一会。

等全部执行完成之后,这时访问http://192.168.78.131:9286,输入用户名和密码之后便可以使用了,

管理

   openpai的管理命令:

python paictl.py service start -c ~/.kube/config   # 启动openpai
python paictl.py service stop -c ~/.kube/config    # 停止openpai
python paictl.py service delete -c ~/.kube/config  # 删除openpai

    kubernetes管理: 

python paictl.py cluster k8s-bootup -p ~/pai-config   # 启动kubernetes
python paictl.py cluster k8s-clean -p ~/pai-config    # 删除kubernetes

有问题加QQ群: 526855734

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Dev-C++是一款开源的集成开发环境,被广泛用于C和C++的编程。下面是关于Dev-C++开发教程的一些重点: 1. 下载和安装:首先,你需要从官方网站上下载最新版本的Dev-C++并进行安装。安装过程非常简单,只需按照向导进行操作即可。 2. 创建新项目:启动Dev-C++后,可以点击菜单栏中的"文件",然后选择"新建",接着选择"C"或"C++"来创建一个新项目。在弹出的对话框中,你可以选择项目的类型和名称。 3. 编写代码:在Dev-C++的编辑器中,你可以开始编写你的C或C++代码。你可以使用标准库函数,也可以添加自定义的头文件和库文件。 4. 编译和运行:完成代码编写后,你需要点击菜单栏中的"运行",然后选择"编译运行"来编译和运行你的程序。如果代码中没有错误,程序将会在控制台中显示运行结果。 5. 调试程序:如果你的程序出现了bug,你可以使用Dev-C++提供的调试功能来找出问题所在。你可以设置断点、逐行执行代码,以及查看变量的值来帮助你调试程序。 6. 打包和发布:一旦你的程序完全运行正常,你可以点击菜单栏中的"运行",然后选择"编译"来生成可执行文件。你可以将可执行文件拷贝到其他机器上运行,也可以将源代码发送给其他人进行查看和修改。 7. 学习资源:除了官方的文档和手册外,你还可以通过网络上的教程和论坛来学习更多关于Dev-C++的开发技巧和技术。社区中的其他开发者也会分享他们的经验和解决方案。 总之,Dev-C++是一个功能强大且易于使用的开发工具,适用于初学者和有经验的开发者。通过学习和实践,你可以掌握使用Dev-C++进行C和C++开发的技巧,并创建出高质量的应用程序。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值