- 博客(68)
- 资源 (4)
- 收藏
- 关注

原创 ceph-ansible安装指南-添加BlueStore
ceph的资料真是很少,摸索一断时间,将整理的一资料和操作经验分享。1、配置需要添加的OSD节点的配置文件 (如没有 host_vras文件夹,可自行创建)1、查看新增OSD节点的磁盘(本测试为三个data磁盘,三个DB磁盘,三个WAL磁盘)2、自行创建osd的配置文件 (注意,lv&vg的名称都要写入)_vg: ceph-block-0 #vg的名称。当使用相同速度的设备,就不需要独立的逻辑卷用于。卷可以随时扩展,方便在后续维护中按需调整。一、新增OSD节点操作。4、查看所有创建的VG。
2022-12-30 16:24:12
1081

原创 ceph-ansible安装指南-centos8安装ceph- pacific
最近玩ceph ,发现关于ceph的安装配置文档还是太少,且不同版的坑也是不一样。介于开源精神,分享下centos8.5环境下的ceph-P版的安装步骤。大前提:chrony服务端客户端配置完后,重启chronyd服务即可快速完成时间同步,在这之后就不要再手动去修改时间了,一切让时间服务器自己去同步。4、备份修改/etc/ansible/hosts文件,4、修改 /etc/hosts文件,进行本地解析。chrony客户端:其他节点,完全一样的配置与操作。8、修改group_vars/osdo.yml配置。
2022-12-02 16:14:23
1907

原创 VSAN故障案例分享——超经典三场景
前言:虽然个人认为现VSAN的常规运维都已经很成熟便捷了(像磁盘更换),但还是有诸多需要注意的地方。近期又突然跟VSAN项目有了一些交集,整理原有资料时,发现有几个不错的案例,故拿出来出大家分享下。如有不足之处,也希望大佬们帮指正。---------------------------------------------------------------------------------------------------------------------------------------.
2020-12-01 11:32:22
4419
2

原创 vRealize Automation(VRA8.1)升级到VRA8.2(一)
前话:现在在使用VRA8系的,基本都是坑友了。本人从8.0躺坑到8.1,再到现在的8.2。原来的各种功能受限制,也曾向厂家人员各种吐槽,到现在的功能逐渐丰富完善。还是能看到希望的。也希望看到本文的朋友们能加一下QQ好友,共同学习,优化蓝图代码,和交流一下设计流程。QQ&微信:82873032-------------------------------------------------------------------------------------------------------.
2020-11-03 10:17:37
692

原创 VMware运维干货分享:使用ESXICLI命令查询,网卡,HBA,RIAD卡信息
前话:我们在运维VMwareESXI主机时,经常会遇到紫屏,网络中断,存储访问慢等种疑难杂症。大多时间都是感觉无从下手,只能截图,重启,收集日记,上报厂家CASE。厂家大多的答复是固件,驱动的兼容问题。今天就分享一下如何使用ESXICLI命令查询三个重灾区:网卡,HBA,RIAD卡信息。一、网卡信息查询:esxcli network nic list 显示网卡列表信息 esxcli network nic get -n vmnicX 显示指定网卡的详细信息 vmkchd...
2020-07-27 17:25:17
17273
1

原创 运维问题一:ESXI同主机上部分VM网络中断,物理网卡有闪断告警
前话:本次问题较为棘手,同主机部分VM通信中断,虽有物理网卡关闭告警信息,但无硬件报错,且有较多业务受影响。处理问题时,需要顶住多部门的压力,优先恢复重要业务,冷静处理问题。最后再做问题追踪,溯源。运维心态:遇到问题不要慌,冷静思考下,逻辑不能乱。一、环境介绍 ESXI6.5二、问题描述 2.1、 Vmware平台物理机(2台)陆续发生3次上联业务平面网卡(万兆物理双上联,其中1块网卡)无法通信的情况,影响部份在此网卡上回源的虚拟机通信中断, 2.2 硬件表现:VC平台...
2020-07-24 17:48:33
7857
1

原创 HCIBench_2.3.1部署_VSAN_测试工具
前话:近期做VSAN性能测试,官方推荐使用HCIBench工具,下载导入后,各种问题,不能正常测试。又是英语渣,搜索中文全网都没有较明细的文档。后经摸索,终于可正常测试,随手记录,并上传。 测试环境: VC6.7 ESXI 6.7 5主机 2*600GBSAS 2*1.6TSSD缓存 11*1.6T SSD容量官网下载OVA模板Guest VM: root password : vdbenchhttps://flings.vmware.com/h...
2020-05-19 16:28:26
7770
3
原创 Prometheus实战教程:k8s平台-Mysql监控案例
配置文件优化后的 Prometheus 自动发现 MySQL 实例的完整 YAML 文件。ConfigMap。
2025-05-16 16:11:22
699
原创 Prometheus实战教程:k8s平台-node-exporter监控物理机
在部署之前,确保你的系统已经安装了 Docker。(1)docker或docker-compose部署 (本文使用)(3)kubernetes中使用daemonset。从 Docker Hub 或其他镜像仓库拉取。的服务器的 IP 地址。
2025-05-08 11:41:24
788
原创 Prometheus实战教程:k8s平台-Redis监控案例
该配置实现了 Redis 实例的自动发现和监控。通过 Redis Exporter 暴露 Redis 指标,Prometheus 自动抓取并存储。适用于生产环境,支持高可用和动态扩展。
2025-05-07 16:30:57
1212
原创 Prometheus实战教程:k8s平台-使用文件服务发现案例
是 Prometheus 中用于的一种配置方式,主要用于通过读取文件中定义的目标地址(targets)来动态更新 Prometheus 的抓取目标(scrape targets)。它非常适合与外部系统集成,比如你用脚本或配置管理工具生成目标列表。
2025-05-06 16:28:01
732
原创 k8s平台:手动部署Grafana
以下是一个可用于生产环境的 Kubernetes 部署 Grafana 的 YAML 文件。该配置包括 Deployment、Service、ConfigMap 和 PersistentVolumeClaim,确保 Grafana 的高可用性和数据持久化。
2025-04-30 15:00:10
772
原创 深入 Prometheus 使用——PromQL 高级查询与告警配置
PromQL 是 Prometheus 的查询语言,能够让你高效地从时间序列数据库中提取数据。在这一阶段,我们将学习如何利用 PromQL 进行更复杂的查询,包括聚合、筛选、统计分析等操作。Prometheus 提供了强大的告警功能,告警规则使用 PromQL 来定义,当某些指标超过预设阈值时触发告警。告警规则需要配置在 Prometheus 的。负责接收 Prometheus 发送的告警,并按照定义的规则来路由、分组和通知告警。)来筛选数据,标签过滤的功能十分强大,支持正则表达式匹配。
2025-04-29 09:43:33
841
原创 Prometheus 实战教程-搭建 Prometheus 环境
用于采集系统级别的硬件和操作系统指标,例如 CPU、内存、磁盘和网络使用情况。创建或修改,添加部分,让 Prometheus 采集 Node Exporter 的数据。job_nametargets在 Prometheus Web 界面,进入,你应该可以看到目标状态为UP。(Prometheus Query Language)是 Prometheus 的查询语言,用于提取和分析时间序列数据。这条查询会返回所有 CPU 时间序列的最新值,包括不同的 CPU 核心和模式(usersystemidle等)。
2025-04-28 17:16:53
547
原创 Prometheus 基础入门详细解析
[IMG-2、阶段 1:Prometheus 基础入门详细解析-20250210170622275.png]][[IMG-2、阶段 1:Prometheus 基础入门详细解析-20250210172102732.png]],特别适合监控云原生环境(如 Kubernetes)。用于采集主机系统的硬件和操作系统指标(CPU、内存、磁盘、网络等)。告警规则(Alert Rules)**和发送告警。在 Prometheus Web 界面上,进入。Prometheus 是一个开源的。Prometheus 通过。
2025-04-28 15:39:44
481
原创 kubernetes环境手动部署 Prometheus 监控系统安装文档
kubectldefaultmonitoringnamespace:为 Prometheus 分配访问 Kubernetes API 的权限。
2025-04-25 15:14:36
762
原创 Prometheus 系统化学习计划-总纲
以下是,帮助新手小白从零基础到生产实践中的熟练应用。整个学习路径分为,每个阶段有明确的学习目标和详细的知识点,最后还配有实战任务和资料推荐,确保理论与实践结合。
2025-04-23 17:34:40
933
原创 Kubernetes学习指南:保姆级实操手册09——harbor镜像仓库安装
1、介绍 Harbor是一个开源注册中心,它通过策略和基于角色的访问控制来保护工件,确保图像经过扫描且没有漏洞,并将图像签名为受信任。Harbor是CNCF Graduated项目,可提供合规性、性能和互操作性,帮助您跨Kubernetes和Docker等云原生计算平台一致、安全地管理构件。参考第八章:持久化存储-NFS安装 [[8、持久化存储部署]]
2024-09-10 15:39:19
294
原创 ESXi 操作系统中,通常会有以下 9 个分区
6. /etc/vmware/weasel:这是 ATS 文件夹,用于存储 ESXi 主机的 ATS 日志文件。9. /vmfs/devices/disks:这是 LVM 文件夹,用于存储 ESXi 主机的 LVM 元数据。4. /dev/sda7:这是 VMKCore 分区,用于存储 ESXi 主机的核心转储文件。6. /dev/sda9:这是 ATS 分区,用于存储 ESXi 主机的 ATS 日志文件。5. /dev/sda8:这是 Core 分区,用于存储 ESXi 主机的核心转储文件。
2024-09-09 17:09:50
1055
原创 Kubernetes学习指南:保姆级实操手册08——持久化存储部署(StorageClass)
NFS(Network File System)卷在Kubernetes中的使用提供了一种将远程文件系统挂载到Pods中的方法。在创建NFS卷时,明确规划数据的组织结构和访问模式,确保Pods能够高效地访问所需的数据。监控NFS服务器的性能和健康状况,确保它能够满足Pods的需求。定期备份NFS卷中的数据,以防数据丢失或损坏。考虑使用Kubernetes的存储类(StorageClass)自动化NFS卷的配置和管理。
2024-09-09 17:00:42
694
原创 Kubernetes学习指南:保姆级实操手册07——calico安装、metric-server安装一、calico
指标服务Metrices-Server是Kubernetes中的一个常用插件,它类似于Top命令,可以查看Kubernetes中Node和Pod的CPU和内存资源使用情况。Metrices-Server每15秒收集一次指标,它在集群中的每个节点中运行,可扩展支持多达5000个节点的集群。Calico是一个开源的虚拟化网络方案,支持基础的Pod网络通信和网络策略功能。
2024-09-06 16:06:18
585
原创 VMware vCenter 7 端口镜像详细操作
在 VMware 环境中,端口镜像(Port Mirroring)允许你复制特定端口的网络流量到另一个端口,以便进行流量分析或故障排除。以下是详细的操作步骤,具体以 VMware vCenter 7 和分布式交换机(vDS)为例。
2024-09-05 14:49:02
1703
原创 Kubernetes学习指南:保姆级实操手册06——部署kubernetes集群
kubeadm在初始化控制平面时会生成部署Kubernetes集群中各个组件所需的相关配置文件在/etc/kubernetes目录下。
2024-09-05 14:46:15
834
原创 Kubernetes学习指南:保姆级实操手册05——配置集群HA负载均衡
简介: Keepalived 提供 VRRP 实现,并允许您配置 Linux 机器使负载均衡,预防单点故障。HAProxy 提供可靠、高性能的负载均衡,能与 Keepalived 完美配合官方文档提供了两种运行方式(此案例使用选项1):参考文档:[https://github.com/kubernetes/kubeadm/blob/main/docs/ha-considerations.md#options-for-software-load-balancing]注:三台master节点上安装1.2、
2024-09-04 17:31:11
648
原创 Kubernetes学习指南:保姆级实操手册04—主机系统初始化
本章节主要内容是对主机操作系统的初始化操作,如发另外标注,所有的节点操作步骤一致,可以使用软件批量初始化。
2024-09-02 10:33:21
1415
原创 Kubernetes学习指南:containerd安装
在1.20版本中将内置的dockershim进行分离,这个版本依旧还可以使用dockershim,但是在1.24中被删除。在centos7中yum下载libseccomp的版本是2.3的,版本不满足我们最新containerd的需求。综上所属,在安装containerd前,我们需要优先升级libseccomp,需要下载2.4 以上的版本即可,我这里部署2.5.1版本。将SystemdCgroup = false 修改为 SystemdCgroup = true。如wet无法下载,可从网页下载上传到服务器。
2024-08-07 17:08:17
500
原创 kubernetes 集群组件介绍
kubernetes 集群组件介绍在Kubernetes(k8s)集群中,主节点(Master Node)和工作节点(Worker Node)都运行特定的软件组件,它们共同管理和运行容器化的应用程序。
2024-08-06 15:41:10
384
原创 kubernetes学习规划和书籍推荐
通过这份详细的学习规划和推荐资料,你可以系统地学习 Kubernetes,从基础概念到高级应用,逐步提升自己的技术水平。
2024-07-30 16:45:00
1469
原创 Kubernetes学习指南:保姆级实操手册03——规划部署
docker、kubelet、kube-proxy 扩展阅读:[[k8s master节点和worker 主要运行的软件]]kubernetes 架构图。
2024-07-22 15:52:57
305
原创 Kubernetes学习指南:保姆级实操手册01——开篇
首先,我们别管什么 Kubernetes的核心概念,如Pods、Deployments和Services,我们将直接进入实操环节,从安装Kubernetes环境,到配置YAML文件,再到应用的部署和监控,每一步都配有详细的操作指导。Kubernetes的世界广阔而深邃,但有了这篇保姆级的实操手册,你将能够避免踩坑,快速上手。最后,记住,Kubernetes的学习之路虽然充满挑战,但只要你遵循正确的步骤,不断实践,就能够逐渐掌握它。虽懒的写,也不知道写什么,但又觉得有必要写些什么,以表达心声。
2024-07-19 16:50:28
230
原创 HW5300V3-ISCSI存储运维,看这一篇就够了05-linux客户机挂载
若是首次配置,请将“node.startup”前的“#”删除。iscsiadm -m node -o update -n node.startup -v automatic #设置开机自启动。运行命令vim /etc/iscsi/iscsid.conf,打开“iscsid.conf”文件。“iscsid.conf”文件中“node.startup”前的“#”表示注释。11、使用命令查看 ”sdb“和”sdc“的WWN,同一个LUN的WWN是相同的。如果界面无任何显示,则说明登录失败。
2023-07-14 14:03:46
1126
原创 HW5300V3-ISCSI存储运维,看这一篇就够了04-创建启动器
仔细阅读对话框内容,确认后勾选“我已阅读上述信息,了解此操作带来的后果”。根据业务需求,选择一个或多个待添加给主机的启动器。选择一个主机,将此主机与启动器关联,单击“确定”。4、系统弹出“执行结果”对话框,提示操作成功。1、 选择“资源分配 >主机 > 启动器”。1、 选择“资源分配 >主机 > 启动器”。2、系统弹出“创建启动器”对话框。2、 系统弹出“关联主机”对话框。在“类型”中选择启动器类型。单击“关联主机”,为主机添加。3、系统弹出高危提示框。
2023-07-14 14:03:03
415
原创 HW5300V3-ISCSI存储运维,看这一篇就够了03——HOST
为实现主机使用LUN,需将主机加入到主机组中。系统是通过为LUN组和主机组建立映射关系,实现主机组中的主机使用LUN组中的LUN。一个主机组可以包含一个或多个主机。如已创建了启动器,选择对应的,下一步。如未创建可直接”下一步“后面创建再关联,本文档先未预先创建先跳过。1、选择“资源分配 >主机 > 主机组”。2、选择“主机”→"创建"→"手动创建"2、系统弹出“创建主机组”对话框。1、选择“资源分配”→“主机”3、设置host属性,下一步。
2023-07-14 14:01:14
514
原创 HW5300V3-ISCSI存储运维,看这一篇就够了02——LUN
为实现主机使用LUN,需将LUN加入到LUN组中。系统是通过为LUN组和主机组建立映射关系,实现主机组中的主机使用LUN组中的LUN。一个LUN组可以包含一个或多个LUN。系统弹出“创建LUN组”对话框。选中LUN→ 右移→确定。2、 单击“创建”。系统弹出“创建LUN”对话框。1、选择“源分配 >LUN > LUN组”。机房_主机名_存储名_LUN数_LUN容量。1、 选择“资源分配 >LUN”。3、 设置LUN的参数。4、单击“确定”,创建LUN。注:LUN的使用类型。设置LUN组的参数。
2023-07-14 13:59:35
533
原创 ceph-cursh规则实战及PGS unknown 问题处理
重新导入集群后,需要把之前存在过的pool池的crush_rule都修一下,否则集群会出现unknown状态有无法达到activee+clean状态。min_size 1 # pool中最小指定的副本数量不能小1。对于比较熟的 crush 配置比较熟悉的老手推荐使用, 线上业务集群慎用。把 ceph 的二进制格式的 crush map 导出并转换为文本格式。5.6、查看pool的使用的crush_rule名称。# 发现使用的crush_rule的id变为1。
2023-01-03 10:14:26
2702
1
原创 ceph-mds文件系统操作指南
Ceph 文件系统 (CephFS) 是兼容 POSIX 标准的文件系统,在 Ceph 的分布式对象存储基础上构建,称为 RADOS(可靠的自主分布式对象存储)CephFS 客户端代表使用 CephFS 的应用执行 I/O 操作,如用于 FUSE 客户端的 ceph-fuse,kcephfs 用于内核客户端。2、将 Ceph 客户端密钥环".keyring"和"ceph.conf"文件 从 Ceph 监控节点复制到客户端节点 /etc/ceph/管理与 Ceph 文件系统中存储的文件相关的元数据。
2022-12-30 17:55:18
3141
原创 ceph部署踩坑——OSD服务无法启动
unable to find any IPV4 address in networks ""start request repeated too quickly for ceph-osd@0.service
2022-11-23 17:35:47
4779
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人