- 博客(40)
- 资源 (3)
- 收藏
- 关注
原创 pod 禁止执行的 dmesg
在 Kubernetes 环境中,尽管 Pod 提供了与主机系统隔离的运行环境,但它们仍然与宿主机共享某些底层资源和环境,如内核。这种设计使得在任何 Pod 内部执行的 dmesg 命令显示的是宿主机的内核日志,而不是特定于 Pod 的日志。内核共享:所有在同一宿主机上的容器(包括 Pod 内的容器)都运行在同一个操作系统内核之上。dmesg 命令显示的是内核的环环缓冲区消息,这些消息是系统级别的,不是隔离在单独的容器或 Pod 中的。
2024-04-27 16:29:57
285
原创 node-driver-registrar 与 csi-plugin 的关联
node driver registrar 和 csi plugin 的关联,明白 kubelet 调用 csi 的大体流程。
2024-04-02 17:51:31
359
原创 prometheus federate ingesting out-of-order samples error
prometheus federate msg="Error on ingesting out-of-order samples" num_dropped
2024-01-17 15:24:40
967
原创 cephadm 创建 ceph cluster
默认情况下, ceph.conf 文件和 client.admin 密钥环的副本保留在具有 _admin 标签的所有主机上的 /etc/ceph 中。我们通常建议为一台或多台其他主机指定 _admin 标签,以便可以在多台主机上轻松访问 Ceph CLI(例如,通过 cephadm shell )。fsid 可以通过 cephadm ls, docker ps, cat /etc/ceph/ceph.conf 等来查找。3 个 monitor, 3 个 osd,3 个 mds, 3 个 rgw。
2023-11-09 18:03:53
138
原创 grafana ui 自动添加特殊字符
通过 grafana(当前使用的古董版本: v6.5.0) 编辑现有的查询语句,光标自动移动到最后了,直接复制编辑完后的语句到 prometheus 执行报错如下如果不看 markdown 原文,完全看不出差别。
2023-10-30 11:31:17
265
1
原创 HEALTH_ERR 1 filesystem is degraded, 1 filesystem is offline , 1 mds daemon damaged - Monitors have
HEALTH_ERR 1 filesystem is degraded, 1 filesystem is offline , 1 mds daemon damaged - Monitors have assigned me to become a standbyceph health detailceph mds statceph fs dumpceph fs statusceph fs ls修复不知其然,不知其所以然。。。
2023-10-23 15:50:21
569
原创 rook-ceph rbd image is still being used
Warning FailedMount 5m6s (x208 over 9h) kubelet MountVolume.MountDevice failed for volume "pvc-xxxxxxx" : rpc error: code = Internal desc = rbd image replicapool/csi-vol-xxxxxxxx is still being used
2023-09-04 15:28:30
224
原创 elastic 删除 index 错误action [indices:admin/delete] is unauthorized for user [admin] with roles
security_exception: action [indices:admin/delete] is unauthorized for user [admin] with roles [superuser] on indices [.kibana_task_manager_8.2.3_001], this action is granted by the index privileges [delete_index,manage,all]
2023-09-02 11:12:05
1127
原创 Grafana - Alert 时间/状态
在 Grafana Alert 中,Evaluate every 和 Evaluate for 是两个重要的配置选项,用于定义告警的评估周期和持续时间。
2023-03-20 11:35:53
3385
原创 使用 Postgres 作为 Grafana 后端,并迁移数据
单纯的使用 PG 用来当 Grafana 的后端存储,这个倒是简单,难的是怎么样把现有数据迁移过去。网络上的方案千千万,N 种方式失败之后终寻得成功。
2022-11-14 15:35:05
718
原创 Docker, Kubernetes, CRI, OCI, Containerd, Runc 之间的渊源
Docker, Kubernetes, CRI, OCI, Containerd, Runc 之间的渊源
2022-10-09 10:48:28
544
原创 Grafana导入 json 文件的 dashboard 错误 Templating Failed to upgrade legacy queries Datasource xxx not found
Templating Failed to upgrade legacy queries Datasource xxx not found
2022-06-14 19:39:57
8287
原创 ceph osd 占用太多的内存
OSD and MON memory consumptionCeph OSD Pod memory consumption very highCeph Cluster CRDCeph HardWare Recommendations
2022-06-09 13:39:18
1923
原创 prometheus operator servicemonitor 添加 label
serviceMonitorSepc.[]endpoint.relabelconfighttps://github.com/prometheus-operator/prometheus-operator/blob/main/Documentation/api.md#servicemonitorspechttps://github.com/prometheus-operator/prometheus-operator/blob/main/Documentation/api.md#servicemonito
2022-02-17 16:27:03
2431
原创 prometheus operator federation
prometheus 通过 prometheus-operator 配置的,怎么样配置联邦呢?先来个官网看看什么是联邦:Federation | Prometheushttps://prometheus.io/docs/prometheus/latest/federation/operator 添加 prometheus 的配置prometheus-operator/additional-scrape-config.md at main · prometheus-operator/prome
2022-02-17 16:11:45
706
原创 POD QoS
Configure Quality of Service for Pods | KubernetesThis page shows how to configure Pods so that they will be assigned particular Quality of Service (QoS) classes. Kubernetes uses QoS classes to make decisions about scheduling and evicting Pods.Before you b
2022-02-16 18:35:00
408
原创 Kubelet: Pod Lifecycle Event Generator (PLEG)
design-proposals-archive/pod-lifecycle-event-generator.md at main · kubernetes/design-proposals-archive · GitHubPod Lifecycle Event Generator: Understanding the "PLEG is not healthy" issue in Kubernetes | Red Hat Developerhttps://developers.redhat.com/
2022-02-16 17:08:09
447
原创 PostGreSQL HA
整理的支持的 PG HA 的各个方案的链接,空了再做个对比吧。PGOhttps://access.crunchydata.com/documentation/postgres-operator/latest/patronihttps://github.com/zalando/patronistolonhttps://github.com/sorintlab/stolonrepmgrhttps://github.com/EnterpriseDB/repmgrPAFhttp
2021-11-29 11:40:58
635
原创 Grafana - Alert
grafana 8 开启自带的 Alert我使用的是 k8s, 采用的是环境变量来打开 Alert 功能1 环境变量: - env: - name: GF_FEATURE_TOGGLES_ENABLE value: ngalert2 配置文件# /etc/grafana/grafana.ini[feature_toggles]# enable features, separated by spaces;enable = ngale.
2021-11-22 14:18:25
1231
原创 curl 访问 private registry 的 api 获取所有镜像
司用 harbar 搭建了docker 的 registry,想一目了然的知道有哪些镜像,但是又不想登录到 harbar 的 ui 在 n 个项目中一个一个看, 故采用 curl 命令来参看所有的镜像,结果告知UNAUTHORIZED, 用户名和密码不用怀疑,肯定对的哈。$ curl -s --user "$U" 172.30.3.149/v2/_catalog | jq{ "errors": [ { "code": "UNAUTHORIZED", ...
2021-10-28 18:27:16
2349
7
原创 Ubuntu 升级 kernel 至 5.13.11(5.15.10)
借鉴最新的 release 版本kernel 的种类说明警告⚠升级有风险,先备份数据以防万一。但用一台虚拟机来折腾升级的过程,这个风险还是能够承受滴,再则,升级失败了,大不了回滚之前的版本呗。现在的版本现在的grub 是这样子滴。ubuntu: 20.04.2kernel: 5.4.0node8:~$ uname -r5.4.0-81-genericnode8:~$ cat /etc/os-releaseNAME="Ubuntu"VERSION="...
2021-09-18 11:46:13
8445
2
原创 etcd cluster 备份恢复实践
数据在手,天下我有。备份创建 etcd cluster不善言语。创建 3 个 member 的 etcd cluster如下 yaml 文件创建的 etcd 集群apiVersion: v1kind: Servicemetadata: name: etcd-headless labels: component: etcd-headlessspec: clusterIP: None ports: - port: 2379 name: cl...
2021-09-16 17:59:09
471
sqlite 中文手册
2010-07-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人