如何将老板的游戏机接入阿里云自建K8S跑大模型(中) - 将自建GPU服务器加入k8s集群做节点

将自建GPU服务器加入k8s集群做节点

前面工作总结

这篇博客是接着前几篇博客写的,我们在阿里云上做了如下工作:

在《 如何将老板的游戏机接入阿里云自建K8S跑大模型(上) - 如何去掉pritunl中的NAT》,中我们只讲了如何拆掉NAT,留了一个尾巴,没讲如何将本地服务器加入到阿里云上的自建K8S,这次来讲一讲。

按装Worker节点服务

curl -sfL https://rancher-mirror.rancher.cn/rke2/install.sh | INSTALL_RKE2_MIRROR=cn INSTALL_RKE2_TYPE="agent"  sh -

systemctl enable rke2-agent.service

mkdir -p /etc/rancher/rke2/
vim /etc/rancher/rke2/config.yaml

编辑配置文件,将服务器的token放到配置中

文件路径:/etc/rancher/rke2/config.yaml

server: https://192.168.10.1:9345
token: *******::server:************

启动服务

systemctl start rke2-agent.service

设置污点

为了让GPU服务器只跑需要GPU的任务,我们需要再这个节点上设置一个污点,有了污点容器默认就不会被调度到这个节点。
在这里插入图片描述

配通网络 (关键点)

我们使用的网络插件是 cannal

给网络插件添加容忍

让网络插件能够在这个节点运行,不然容器间的网络会有问题:
在这里插入图片描述
设置后,网络依然不通,本地节点的容器 和 云服务器上的容器之间的网络不通

配置网络插件

网络不通的原因:canal会在K8S节点一个 VTEP 设备,默认监听的 是 eth0网卡,与云上的服务器通信只能使用 VPN 创建的 虚拟网卡 tun0
所以,必须让 VTEP 设备使用虚拟网卡tun0
解法:可以配置正则自动匹配
在这里插入图片描述
rke2canal VTEP设备 监听的默认端口是 :8472/UDP
所以,还需要在阿里云安全组上做 端口放行;修改VPN服务器所在注意的安全组,增加如下规则:
在这里插入图片描述

参考文章:
feat: add support for --iface-regex match interface with multi IP addresses
什么是VXLAN


gone是我开发的一个golang依赖注入框架,编写web服务器超级方便,麻烦帮忙点个赞吧?
gone的项目地址:https://github.com/gone-io/gone

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

dapeng-大鹏

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值