K8S
文章平均质量分 78
process1212
有效率的工作和加班
展开
-
saltstack安装
1. 安装1.安装步骤 找到对应的源加入salt的源[root@10-8-58-159 ~]# yum install -y https://repo.saltstack.com/py3/redhat/salt-py3-repo-3001-1.el8.noarch.rpmLast metadata expiration check: 0:00:43 ago on Mon 28&原创 2022-02-28 22:01:01 · 681 阅读 · 0 评论 -
DCGM Exporter
写在前面:健康检查:https://docs.nvidia.com/datacenter/dcgm/dcgm-user-guide/feature-overview.html#background-health-checks其实我想找到能够检测gpu error 不能使用的metrics,但是没有找到,呜呜呜呜呜。寻求解决方案,欢迎留言一、背景因为gpu集群越来越大,为及时发现故障需要设置gpu物理告警。二、相关方法论1、dcgm-exporter是能够拿到gpu的使用量、温度、一些ecc错误数的指标。但是原创 2022-02-16 21:59:47 · 2185 阅读 · 0 评论 -
创建BPF映射方式
???? BPF映射如何创建程序员经常向程序传递消息引起程序行为被调用。bpf 最神奇的功能就是内核中运行的代码,和加载这些代码的程序可以通过消息传递方式实现实时通信。BPF 映射是键值保存在内核中,可以被 BPF 程序访问。用户空间的程序也可以通过文件描述符访问 bpf 映射。bpf 映射中可以保存事先指定的大小任何类型数据。内核将键值作为二进制块,内核并不关系 bpf 映射的具体内容,由验证器来保证安全。创建 BPF 映射创建 BPF 映射最直接的方法是使用 bpf 系统调用,第一个参数设置原创 2022-02-09 00:07:16 · 610 阅读 · 0 评论 -
BPF验证器
???? hello everyone !!!BPF能够允许任何人在linux内核中执行任意代码,那么安全性怎么保证呢?CVE-2017-16995 https://cve.mitre.org/cgi-bin/cvename.cgi?name=CVE-2017-16995Dave S.Miller 的话说:“eBPF验证器是eBPF程序与毁灭的深渊之间的分水岭。”BPF程序曾经出现过一些漏洞,例如允许攻击者甚至在非特权模式下访问内核的随机内存。为了阻止诸如此类的问题发生,验证器的第一项检查就是对原创 2022-01-17 22:51:06 · 1758 阅读 · 0 评论 -
kubernetes审计
写在前面:用到的一些参考链接官方介绍:https://github.com/kubernetes/website/blob/release-1.12/content/zh/docs/tasks/debug-application-cluster/audit.md阿里云介绍:https://help.aliyun.com/document_detail/91406.html腾讯云介绍:https://cloud.tencent.com/document/product/457/50510ucloud配置原创 2022-01-12 23:21:45 · 612 阅读 · 0 评论 -
BPF程序
bpf程序能够在一些内核事件触发时运行。bpf程序需要被bpf虚机机进行加载,加载的时候需要知道具体的程序类型。1. hello word!一般常见使用C语言子集编写BPF程序,使用LLVM编译器进行编译。LLVM能够编译出加载到内核中执行的汇编代码。bpf程序编译后,内核通过bpf系统调用将程序字节码加载到bpf虚拟机中。#include <linux/bpf.h>#define SEC(NAME) __attribute__((section(NAME), used))s翻译 2021-12-27 23:31:12 · 713 阅读 · 0 评论 -
kubelet参数解释about kubelet gc image and evict pod.
???? something about kubelet gc image and evict pod.1. imagefs删除镜像的规则1.1 官网介绍1.1.1 参数介绍imageMinimumGCAgemeta/v1.Duration imageMinimumGCAge is the minimum age for an unused image before it is garbage collected. Dynamic Kubelet Config (beta): If dynam原创 2021-11-12 11:01:37 · 1720 阅读 · 0 评论 -
Kubernets中的IPVLAN如何使用???
2. ipvlanmacvlan是有一些局限性的,ipvlan也能够解决macvlan的一些限制。macvlan和ipvlan虚拟网络模型提供的功能看起来差不多。macvlan存在一些先天不足:无法支持大量的mac地址无法工作在无线网络环境中2.1 ipvlan介绍ipvlan也是从一个主机的接口虚拟出多个网络接口。区别在于ipvlan的所有虚拟接口都是用相同的mac地址,而ip地址却各不相同。因为共享mac地址,所以DHCP的场景一般会使用mac地址作为机器的标识。在macvlan的场景下原创 2021-10-07 22:19:16 · 510 阅读 · 0 评论 -
更新yum服务器的方式
更新yum服务器文件登录yum主机将所需要的文件传至此主机。[root@fileserver zhf]# scp -r root@101.36.113.51:/root/1.22.2/*1.22.2* .The authenticity of host '101.36.113.51 (101.36.113.51)' can't be established.ECDSA key fingerprint is SHA256:21IB7b819QmfdMsyxXKOR/oXITuAZ23iVigHr原创 2021-09-28 12:30:47 · 848 阅读 · 0 评论 -
NUMA知识扫盲
NUMA相关numa:参考: https://www.cnblogs.com/machangwei-8/p/10402644.htmlhttps://www.thegeekdiary.com/centos-rhel-how-to-find-if-numa-configuration-is-enabled-or-disabled/、架构演进SMP 到 NUMA所谓对称多处理器结构,是指服务器中多个CPU对称工作,无主次或从属关系。各CPU共享相同的物理内存,每个 CPU访问内存中的任何地址所转载 2021-08-16 16:31:52 · 1654 阅读 · 0 评论 -
kubernetes endpoint 代码阅读
“ 想了解service和pod之间的关系”kubernetes的服务可用性通过endpoint来控制,直接决定是否能够将流量打入到后端服务中。01—endpoint controller首先看一些常量参数:maxRetries: 服务在退出队列之前的重试次数。会因为限速控制器,重试间隔越来越长。maxCapacity: 存储在endpoint资源中的最大地址数,在未来的版本中可能会超过此长度的控制。const ( // maxRetries is the number of times a原创 2021-07-01 18:41:32 · 526 阅读 · 0 评论 -
Kubernetes scheduler代码解读
scheduler 调度器代码解读调度器程序入口:通过app.NewSchedulerCommand使用cobra执行命令运行scheduler。原创 2021-05-07 19:49:37 · 534 阅读 · 1 评论 -
kubernetes velero 使用奇技淫巧
你是否在运维kubernetes集群中有过这样的经历:一个新人把某个namespace点击删除,导致这下面所有的资源全部丢失,只能一步一步的重新部署。新搭建集群,为了保证环境尽可能一致,只能从老集群拿出来yaml文件在新集群中疯狂apply。令人抓狂的瞬间随之而来的就是浪费大好青春的搬砖时光。现在已经开源了很多集群资源对象备份的工具,把这些工具利用起来让你的工作事半功倍,不在苦逼加班。集群备份比较etcd备份etcd备份可以实现K8S集群的备份,但是这种备份一般是全局的,可以恢复到集群某一时刻原创 2021-03-07 16:33:33 · 2957 阅读 · 0 评论 -
keda--kubernetes实现扩缩容的利器
第1章 kubernetes原生的扩缩容介绍引用链接:https://mp.weixin.qq.com/s/mRwvZBVfWPYvE7hERbGMTAhttps://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/https://github.com/kubernetes-sigs/custom-metrics-apiserverhttps://kubernetes.io/zh/docs/tasks/run-ap原创 2021-02-23 00:07:57 · 810 阅读 · 0 评论 -
容器平台自愈简介,kubernetes集群巡检 remedy controller
容器平台自愈简介公有云现状摘自:https://mp.weixin.qq.com/s/CLoALO6r9bb3cE7CLTvZUQ各类硬件和软件故障已成为常态,直接导致 Kubernetes 集群工作节点时常处于一种不稳定的状态,人肉运维不仅效率低下,误操作及 24 小时 OnCall 也是巨大的挑战,因此容器服务通过托管节点池为用户提供了一个自愈的免运维的云上 Kubernetes 集群服务。本文将重点介绍如何通过托管节点池实现 Kubernetes 节点自愈能力。阿里云公有云提供了.原创 2021-02-21 18:52:49 · 1192 阅读 · 0 评论 -
node_lifecycle_controller
个人理解,欢迎指正节点控制器的工作原理版本: rancher/kubernetes v1.17.5代码部分:nodeliefcyclenode_lifecycle_controller.gofunc init() { // Register prometheus metrics Register()}metrics.go// Register the metrics that are to be monitored.func Register() { registerMet.原创 2021-01-30 16:40:22 · 811 阅读 · 1 评论 -
ebpf的大杀器cilium可视化追踪hubble部署方式和展示
12月-hubble and check写在前面: hubble的yaml文件: cilium 1.7版本 https://github.com/cilium/hubble/tree/v0.5/tutorials/deploy-hubble-servicemap 测试的yaml文件: https://github.com/cilium/cilium/blob/master/examples/kubernetes/connectivity-check/connectivity-check.yamlcili原创 2020-12-28 21:02:09 · 2303 阅读 · 0 评论 -
节点网络BGP链接探测Bird-Exporter
Bird-Exporter可根据指标进行判断bgp连接是否正常bird_protocol_up{export_filter=”(unnamed)”,import_filter=”(unnamed)”,ip_version=”4”,name=”uplink0”,proto=”BGP”} 0当bgp建立连接失败# HELP bird_protocol_up Protocol is up# TYPE bird_protocol_up gaugebird_protocol_up{export_filt原创 2020-12-28 15:39:31 · 400 阅读 · 0 评论 -
华为鲲鹏服务器国产统信系统ARM64架构的kubernetes上的flannel网络排查
记一次醉生梦死的容器网络排查情况rkeflannel首先,在适配 统信系统 的鲲鹏服务器的时候遇到了网络的问题。从canal到calico再到flannel挨个玩了一遍,最终在iptables层解决掉得。rke先介绍一下rke:RKE是一款经过CNCF认证的开源Kubernetes发行版,可以在Docker容器内运行。它通过删除大部分主机依赖项,并为部署、升级和回滚提供一个稳定的路径,从而解决了Kubernetes最常见的安装复杂性问题。当我清理集群的时候rke remove命令会删除clus原创 2020-11-30 22:43:41 · 1494 阅读 · 2 评论 -
验证扩容
--------------------------------------------------------------------------------------------------洛阳核心域进行主机的查看,主机类型的转化,成为共享类型,添加主机标签。 创建存储卷进行读写,注意所属集群 创建服务,注意创建的位置,然后选择创建镜像服务。 创建服务的过程中,选择主机亲和,pod...原创 2019-04-08 17:33:48 · 299 阅读 · 0 评论 -
docker学习--2019年4月10日
原创 2019-04-10 11:16:51 · 162 阅读 · 0 评论