自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 postgresql运维问题解决:PG集群主节点发生脑裂处理办法

数据库集群出现脑裂问题,排查因corosync进程异常导致VIP资源冲突。通过强制重启故障节点或云平台虚拟机重启,并重建异常备库后问题解决。

2025-08-19 09:30:00 678

原创 postgresql运维问题解决:PG集群备节点状态异常告警处理

PostgreSQL集群备节点状态异常,排查因心跳超时导致节点状态为stop/alone。通过集群状态检查与恢复命令resourcecleanup或深度日志分析/重构备节点解决。

2025-08-14 09:30:00 330

原创 postgresql运维问题解决:PG数据库状态会话过多处理

PostgreSQL数据库出现资源告警问题,排查因idle/idle in transaction会话堆积。通过SQL筛选非活跃会话并终止相关进程后问题解决。

2025-08-12 09:30:00 327

原创 postgresql运维问题解决:PG集群无主节点恢复指南

pg数据库集群定位系统故障困难,排查因缺乏标准化操作指南。通过实施系统日志收集与CPU/IO资源监控解决。

2025-08-07 13:19:49 233

原创 Linux应急手册第四期

十年深耕运维行业,小亦知识库Linux应急手册为运维人员定位系统故障,排查故障原因提供标准化操作指南。

2025-08-05 09:23:44 382

原创 Linux应急手册第三期

二十年深耕运维行业,小亦知识库Linux应急手册为运维人员定位系统故障,排查故障原因提供标准化操作指南。

2025-07-31 09:30:00 1720

原创 Linux应急手册第二期

二十年深耕运维行业,小亦知识库Linux应急手册为运维人员定位系统故障,排查故障原因提供标准化操作指南。

2025-07-29 09:30:00 804

原创 Linux应急手册第一期

二十年深耕运维行业,小亦知识库Linux应急手册为运维人员定位系统故障,排查故障原因提供标准化操作指南。

2025-07-24 09:30:00 668

原创 mysql运维问题解决:MySQL主从延迟(无主键表)

MySQL主从复制出现延迟问题,排查因无主键表导致全表扫描及大事务操作影响。通过重建延迟节点、添加缺失主键并拆分大事务后问题解决。

2025-07-22 09:30:00 1037

原创 mysql运维问题解决:MySQL主从延迟(锁阻塞与读写分离)

数据库从库出现主从延迟告警,排查因从库查询锁阻塞复制线程。通过收集线程信息、优化慢SQL及分散跑批任务负载后问题解决。

2025-07-17 12:06:38 1114

原创 mysql运维问题解决:MySQL参数配置与部署环境优化

关键参数配置不当、MySQL数据存储于NFS性能隐患及资源竞争导致工单系统访问异常。通过修改参数至安全值、迁移MySQL至本地SSD磁盘并部署独立服务器解决。

2025-07-15 09:30:00 920

原创 mysql运维问题解决:数仓mysql异常重启

MySQL主节点异常重启,排查后通过升级版本、调整系统资源限制与参数优化及修复表文件后问题解决。

2025-07-10 09:30:00 820

原创 Oracle应急处理:ORACLE XA 交易挂起

Oracle数据库出现XA交易挂起问题,排查因两阶段提交协调器故障导致交易滞留PREPARE状态。通过CICS端PURGE交易或数据库端强制提交/回滚后清理残留记录解决。

2025-07-08 09:30:00 1190

原创 Oracle应急处理:Oracle 内存泄漏但系统可telnet登陆

Oracle数据库出现内存泄漏问题,排查因PGA/SGA泄漏导致内存换页异常。通过收集进程信息或查询内存占用SQL后,采取终止进程或重启实例解决。

2025-07-03 09:30:00 652

原创 Oracle应急处理:Oracle RAC 集群节点进程通信出现报错

Oracle RAC集群出现IPCSENDTimeout错误,排查因节点间IPC通信故障。通过检查资源状态、重启节点服务及收集诊断信息后问题解决。

2025-07-01 09:30:00 629

原创 Oracle应急处理:IO等待严重,数据库业务响应慢

Oracle数据库业务响应缓慢,排查因高IO负载导致系统延迟。通过iostat、AWR/ASH报告定位高IO会话后终止问题会话解决。

2025-06-26 09:30:00 1374

原创 GaussDB 运维问题解决:Broken pipe连接中断

GaussDB数据库使用gs_dump出现Broken pipe连接中断,排查因事务空闲超时。调整参数idle_in_transaction_timeout并通过gs_gucreload生效后问题解决。

2025-06-24 09:30:00 602

原创 GaussDB 运维问题解决:Ustore 并发更新报错

GaussDB 5.0.3 Ustore引擎高并发UPDATE报错,因BEFORE UPDATE触发器限制。通过删除触发器迁移逻辑至应用代码、改用astore存储模式(官方推荐Ustore)后问题解决

2025-06-19 09:30:00 772

原创 GaussDB运维问题解决:高并发下内存不足

GaussDB数据库高并发下内存不足,排查因max_dynamic_memory动态内存溢出。通过扩容硬件至32C128G并优化max_process_memory参数后问题解决。

2025-06-17 09:30:00 983

原创 GaussDB运维问题解决:服务器扩容后监控与调度决策错误

DN节点内存扩容至256G后tpops仍显示128G,导致监控与调度决策错误,排查因core.dbs_host_specification_info表配置未自动更新。手动执行SQL更新内存值后问题解决。

2025-06-12 09:30:00 908

原创 GaussDB运维问题解决:线程阻塞导致事务死锁

GaussDB数据库出现事务死锁问题,排查因Ustore存储引擎TD槽位竞争。调整init_td参数值后问题解决。

2025-06-10 09:30:00 1233

原创 小亦工单案例:kafka集群 KRaft 模式开启 SCRAM-SHA-256 SASL_PLAINTEXT 认证报错

Kafka集群SCRAM认证异常:KRaft模式集群启用SCRAM-SHA-256 SASL_PLAINTEXT认证时报错,客户端连接失败。问题成功解决:kafka-confgs.sh -alter单节点执行凭证创建;按需独立格式化目标节点磁盘;客户端启动前配置admin.conf并显式引用。

2025-06-06 15:48:17 1201

原创 Redis运维问题解决:哨兵集群QPS飙升排查及解决方案

Redis哨兵集群QPS飙升至7万+,排查发现主节点负载突增。优化方案:1)将哨丘架构改为三主三从集群架构分担负载:2)优化应用层跑批任务降低执行频率

2025-06-05 09:30:00 624

原创 Redis运维问题解决:命令执行超时 连接资源不足

Redis连接异常问题表现为无法获取集群节点信息。经排查因内存使用峰值超过预设最大值,触发频繁内存淘汰导致性能下降。通过Redis命令行工具可快速验证集群健康状况

2025-06-03 09:16:37 558

原创 Redis运维问题解决:连接异常

Redis连接异常,表现为无法获取集群节点信息。经排查发现Redis日志缺失且从节点关闭导致高可用失效,建议启动从节点保持高可用。

2025-05-29 09:29:27 534

原创 Redis运维问题解决:队列堆积故障

Redis队列因内存不足触发Swap交换导致性能下降,考虑避免使用Swap分区以确保性能。

2025-05-27 09:30:00 382

原创 小亦,大模型与智能运维的新篇章

小亦运维平台是中亦科技基于20年深耕运维行业经验结合大模型技术,最新推出的智能运维服务平台,旨在以更智能的方式为运维用户解决运维难题,提升运维工作效率。

2025-05-08 09:30:00 513 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除