![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
k8s
文章平均质量分 93
死亡之翼归来
行走世间,都是怪物。
展开
-
spark支持深度学习批量推理
在数据量较大的业务场景中,spark在数据处理、传统机器学习训练、深度学习相关业务,能取得较明显的效率提升。本篇围绕spark大数据背景下的推理,介绍一些优雅的使用方式。原创 2023-08-31 20:11:24 · 1600 阅读 · 0 评论 -
K8s operator从0到1实战
k8 crd入门原创 2023-08-06 17:25:44 · 906 阅读 · 0 评论 -
使用kubeflow调参工具Katib
调参工具的工作原理是:将深度学习的训练、实验过程以kubeflow任务的形式发布,多次实验迭代会有多个任务发布;目前Katib能支持一些主流算法框架,如tensorflow、mxnet、pytorch、xgboost等。目前Katib调参功能细化为:超参数调节和神经网络结构搜索,开发者可以在kubeflow ui中实现配置和发布调参任务。Hyperparameter Tuning如下图所示,开发人员在ui中设置调参配置有两种方式:对k8s比较熟练的人员可以选择yaml文件配置;不熟练的人员可以选择原创 2020-10-30 20:30:48 · 1696 阅读 · 0 评论 -
使用dashboard查看k8s任务和资源使用
dashboard原创 2020-09-25 21:44:29 · 2964 阅读 · 0 评论 -
安装kubeflow
此处为安装kubeflow 1.0.2版本的教程,其他版本仅作为参考。准备工作如果没有配置docker访问外网代理,可以参考离线安装docker配置代理部分如果没有安装kubernetes集群,可以参考离线使用kubeadm安装kubernetes集群下载需要的资源1.从https://github.com/kubeflow/kfctl/releases/下载v1.0.2版本对应的kfctl二进制文件:解压安装包并添加到执行路径:tar -xvf kfctl_v1.0.2-0-ga47628原创 2020-07-24 21:43:29 · 2876 阅读 · 29 评论 -
离线使用kubeadm安装kubernetes集群
由于生产机器网络的原因,在这里安装工具和镜像均使用离线的方式环境准备准备至少满足2c1g性能的机器若干1.关闭防火墙systemctl stop firewalldsystemctl disable firewalld2.关闭selinuxsed -i s/SELINUX=enforcing/SELINUX=disabled/g /etc/selinux/configsetenforce 03.关闭swapswapoff -acp /etc/fstab /etc/fstab_bak原创 2020-07-24 20:57:46 · 1344 阅读 · 2 评论