- 博客(48)
- 收藏
- 关注
原创 H3C UniServer R4950 G5 服务器压测实战:13根内存条24小时压力测试全流程
本文介绍了对H3C UniServer R4950G5服务器(配置13根64GB ECC内存)进行的24小时内存压力测试方案。测试采用stress-ng工具进行多模式内存读写验证,配合rasdaemon监控ECC错误,
2026-05-21 10:23:32
548
原创 AI运维接入Prometheus——理论可行性的分析
本文提出在现有Prometheus+Grafana监控体系上叠加AI层的智能运维方案。方案聚焦三大场景:1)智能对话巡检,实现自然语言查询指标;2)自动填写巡检表,80%线上巡检条目可自动化;3)告警增强,提供根因分析和处置建议。通过部署Dify平台和调用DeepSeek API,构建AI Agent中枢层,保留现有基础设施不变。实施后预计每月可节省16小时重复工作,告警响应时间从5-10分钟缩短至1分钟。方案分四个阶段实施,优先实现自动填表功能。关键风险包括API调用失败和数据安全问题,建议设置超时降级机
2026-05-21 10:14:07
582
原创 Prometheus Loki 日志告警监控系统部署
基于已安装 Prometheus+Grafana+Node Exporter 的 Ubuntu/Debian 环境,新增企业微信告警能力与 Loki 日志采集分析能力,实现监控告警闭环与日志统一管理。
2026-05-15 10:43:42
389
原创 堡垒机-Jump Server的部署
文章用最直白的步骤,带你完成环境检查、下载配置、一键部署、启动验证,全程可照抄命令。部署后可统一管理账号、权限、操作日志,实现谁、何时、在哪台机器、做了什么全程可追溯,安全又规范。不管是运维入门还是生产落地,看完就能直接搭一套能用的堡垒机。
2026-05-11 16:55:30
424
原创 监控平台Prometheus+Grafana的部署
本文介绍Ubuntu/Debian下**Prometheus+Grafana监控部署**:开放9100/9090/3000端口,依次安装Node Exporter、Prometheus、Grafana,完成配置、开机自启与验证;支持集群扩展,修改Prometheus配置添加多节点即可实现统一监控可视化。
2026-05-08 09:28:24
783
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1