- 博客(101)
- 收藏
- 关注
原创 海量数据库安装部署初体验
今天受所长邀请体验一下海量数据库于是我到官网上找安装包结果没找到。。。。最后问了所长原本在学堂里这次在 Oracle Linux 7.9 上安装 Vastbase ,需要注意两点:系统依赖补齐 和 内存参数调优。前期安装器能正常运行,但会因为缺少 perl、libicu、tcl、bzip2 等依赖导致安装中断。还有一点是 memory out of limit 启动失败问题,原因是默认模板配置中 shared_buffers、wal_buffers、max_connections 等参数过大,需要修改。
2026-01-21 22:46:30
679
原创 VMware虚拟机上Oracle 19C RAC超详细静默安装部署流程(新手必看)
这次我详细的把 19c RAC 从环境准备 → GI 安装 → ASM 磁盘组 → DB 软件 → DBCA 静默建库 整个流程非常详细的记录了下来。RAC 的难点往往不在安装命令本身,而在前置依赖和细节一致性。
2026-01-12 19:45:41
1339
7
原创 为什么你的Bonding总是单线跑?一文讲透layer2/layer2+3/layer3+4
今天同事在部署环境的时候遇到了一个奇怪的问题:两台服务器 A, B。操作系统是银河麒麟,过交换机做LACP bond mode4链路聚合,使用的默认layer2哈希策略,LACP已协商成功,聚合状态为UP。但是通过iperf3多并发测试流量长期集中在一条物理链路。于是针对这个场景展开了排查最终锁定在参考资料:1.2.3.4.
2026-01-06 12:18:56
851
原创 别再手动绑网卡了:我写了一个 Bond 自动化脚本
在做服务器网络配置的时候常常需要对网卡进行绑定,but有些情况下冗长的命令不能复制粘贴就很麻烦,于是我写了个脚本。Active-Backup(主备模式):因其简单和可靠性,通常用于需要高可用性的场景。Balance-RR(轮询模式):因其简单实现负载均衡,适用于需要提高带宽的场景。802.3ad(LACP模式):在需要遵循标准协议且交换机支持LACP的环境中广泛使用。
2025-12-20 22:01:59
462
1
原创 模拟一次普通分区根目录扩容
在使用 LVM 的场景下,逻辑卷的扩容通常比较轻松。但在某些受限环境中(例如无法连接公网、又处于涉密或内外网隔离环境)或特殊条件下系统采用传统分区模式进行部署。此时,如果根分区空间不足,扩容将变得相对复杂。因为普通分区根目录是直接建立在物理分区之上的,要扩容根分区的话就需要修改磁盘分区表,分区表是系统最底层最关键的数据结构之一,所以操作中一点小失误就会导致数据全部丢失,属于高危操作。但是能不能扩容呢?答案是能!看清当前分区状态做备份(分区信息 + fstab + UUID)
2025-12-09 22:56:15
635
原创 别再乱用dd和fio了!一篇文章彻底讲清底层原理,从性能测试小白变专家
dd:最原始的块拷贝工具,经常被拿来做顺序读写粗测;fio:专业的 I/O 性能测试工具,能模拟各种复杂业务场景,比如数据库 OLTP 的 4K/8K 随机读写。很多人只会照着命令敲,但不清楚底层到底在干什么:这些命令测出来的 MB/s、IOPS、延迟到底意味着什么?哪些是真实磁盘性能,哪些其实是内存 / 缓存的幻觉呢?本质就是用户态循环调用 read / write 的块拷贝程序;
2025-11-26 23:09:21
1053
1
原创 记录一次虚机硬盘扩容
查看当前磁盘与 LVM 状态 使用 df -h、lsblk、vgdisplay 查看根分区、VG、LV 的实际容量,确定根分区空间不足且VG 无可用 PE。在 VMware 扩容虚拟磁盘 将磁盘容量从 100G 扩到 200G扩展底层分区 /dev/sda2 使用 parted 命令调整分区大小: resizepart 2 100% 将 sda2扩满整个磁盘。扩展 PV(物理卷) 底层分区扩展后,通过 pvresize /dev/sda2 让 LVM 识别到新增空间。
2025-11-17 02:08:28
569
原创 使用chrony配置时间同步
chrony适用于:RHEL 8/9、CentOS Stream 8/9、Oracle Linux 8/9、Rocky/Alma Linux 8/9等等推荐场景:服务器时间一致性要求高的环境,例如数据库集群(Oracle RAC)、分布式中间件、Kubernetes、Ceph、Kafka、Redis 主从等。chrony是ntpd的替代方案,在RHEL 8+/OL8+系统中已成为默认时间同步服务。命令作用查看 NTP 源和状态查看同步精度立即强制同步时间重启 chrony 服务。
2025-11-06 23:27:43
684
1
原创 iSCSI 磁盘扩容后节点不刷新容量的问题解决(StarWind + Linux)
扩容Target后,客户端必须手动触发SCSI rescan,不然不会生效。
2025-11-06 22:17:02
588
1
原创 金仓KCSM认证攻略:经验分享
说到国产数据库,人大金仓(Kingbase)绝对是绕不开的名字。它是由中国人民大学团队自主研发的关系型数据库系统,已经在金融、电信、政务等行业跑了二十多年。现在国家信创工程全面推进,金仓也成为国产替代的核心产品之一。它的企业级版本 KingbaseES 在兼容 Oracle 的同时,也保持了与 PostgreSQL 的技术延续性。作为老牌数据库,金仓的培训我个人觉得做的是非常不错的,无论是直播还是录播,提供PDF格式的课件与操作脚本,培训的老师对提出的问题都会进行耐心的解答。KCSM。
2025-10-28 14:11:19
1015
原创 GNOME桌面崩溃解决方案
centos系统的GNOME桌面核心包的依赖链损坏导致错误,运行yum update --skip-broken 后,yum自动修复了不一致的依赖,让gnome-shell与底层库重新匹配,桌面恢复正常。
2025-10-06 00:37:20
639
原创 通过ISO镜像挂载本地yum源
在 Kylin / CentOS / RHEL 等 RPM 系 Linux 中,我们常通过挂载 ISO 镜像来搭建本地 YUM 源。但不同版本的 ISO 内部结构不完全一样,repo 文件的写法也不同。那么,如何根据 ISO 目录结构来写对 repo 文件呢?借着这次部署环境顺便记录一下。先挂载 ISO → 再看目录结构 → 决定 repo 写法。如果有,就写两个源;如果只有,就写一个源。
2025-09-12 14:56:15
481
原创 在银河麒麟Kylin V11部署KingbaseES初体验
本文详细记录了在银河麒麟Kylin V11操作系统上部署人大金仓KingbaseES数据库的全过程。首先介绍了Kylin V11的下载安装步骤,包括镜像获取、系统配置和初始化设置。随后重点讲解了KingbaseES的安装前准备、命令行安装方法及安装后验证。整个过程涉及系统用户创建、目录权限设置、安装包校验等关键环节,并提供了详细的命令行操作截图。通过initdb和sys_ctl命令完成了数据库初始化和服务启动,最终成功部署了KingbaseES V9数据库环境。文章为国产操作系统与数据库的部署实践提供了详细
2025-09-03 00:03:15
1704
4
原创 记录一次云平台网卡丢包告警案例分析与解决
摘要 云平台监控频繁出现"节点网卡接收数据包错误数超阈值"告警,经排查发现是存储节点业务网卡的rx_missed_errors计数器持续增长,表明存在硬件层丢包风险。根本原因为网卡接收环形缓冲区(RX ring)容量不足,突发流量导致队列溢出。通过ethtool将RX ring从默认值扩容至2048后问题解决。此方案通过增大缓冲容量缓解瞬时流量冲击,但需注意可能增加内存占用和延迟,且无法解决CPU处理能力不足等深层瓶颈。建议在高流量场景中结合中断优化与队列配置进行综合调优。
2025-08-19 09:44:14
1106
原创 【每日一错】自治事务结束
Oracle 中,只有把事务表槽位写成最终状态并记录提交 SCN(或回滚)——也就是(显式或隐式)——才真正结束一个事务;其他语句都只是“讲述过程”,不是“画上句号”。
2025-08-10 15:32:43
875
原创 vCPU入门讲解
vCPU是虚拟机的虚拟化计算核心,用户可以根据需求在云平台中配置它的数量,以满足不同应用的计算需求。它通过虚拟化技术共享物理CPU资源,但其性能可能受底层资源和虚拟化平台配置的影响。
2025-08-08 17:15:31
516
原创 记录一次Inspur服务器raid配置流程
启动服务器 → 进入 UEFI RAID HII 界面↓查看磁盘状态(Unconfigured Good)↓Create Virtual Drive → 选择 RAID1 → 配置参数↓保存并确认 → RAID 创建成功↓查看虚拟盘状态为 Optimal。
2025-08-07 16:02:11
844
原创 一次“无告警”的服务器宕机分析:从无迹可寻到精准定位
日志没报错不代表没问题,尤其是底层硬件故障,系统常常来不及上报关于BIOS固件更新,新版本BIOS经常会更新cpu微码,修复隐藏bug带外监控不能代替主动巡检,带外管理只能检测报的出来的问题“没有告警”的服务器问题,是运维中最难处理的一类故障。日志之外,还有真相;症状之外,要靠逻辑。希望这次 CPU 故障排查记录对你有帮助。如果你在日常运维中也遇到类似“无预警宕机”问题,欢迎留言交流。
2025-08-05 22:01:31
510
原创 存储学习笔记
今天,我系统性的学习并整理了与近期项目相关的一些存储知识,重点围绕华为/浪潮存储、云平台、操作系统与数据库,理解了从入门到生产环境部署的一些技术点。整理了下来通过今天的学习,初步建立了对企业级存储、数据库高可用部署、多路径配置、国产数据库适配的认知。存储不仅仅是简单的硬盘空间,它是数据库和云平台稳定运行的底座。今天的学习为我打下了国产化进程中不可或缺的基础知识,后续将持续深入实践。
2025-07-31 17:33:02
918
原创 【每日一错】ROWNUM伪列限制查询
伪列是Oracle自动提供的一种列,他不存在于表结构中,但存在于查询执行的过程中。运行时才临时存在的,只能用于当前查询语句中,不存入磁盘、不占表空间。ROWNUM 是 Oracle 中的一个伪列,会将查询结果的行号,从1开始自动编号。
2025-07-30 11:26:44
449
原创 【每日一错】Oracle 19c CDB中如何启动一个PDB
可以将CDB看作是一个公司总部,管理多个字公司PDB,每个子公司可以独立运营。公司总部CDB,它拥有一些重要的共享资源,比如财务管理系统、公司规则、法律支持等。总部负责统筹和管理这些资源,但并不直接参与到每个子公司的具体运营中。总部有一个共同的资源池,这些资源可以供所有子公司使用。每个 PDB 就是 CDB 下面的一个子公司。每个子公司有自己的员工、办公场所和独立的运营计划,能够按照自己的需求和目标来开展业务。
2025-07-29 15:35:47
465
原创 【每日一错】PostgreSQL的WAL默认段大小
事务先写日志文件(WAL)到磁盘。后台慢慢将变更同步到数据页(实际数据文件)。如果崩溃了,可用 WAL 把未完成事务重放(replay)。WAL是PostgreSQL先写日志、后写数据的机制,用来防止数据丢失、提升数据恢复能力。每段的默认大小为:16MB(也就是 16 × 1024 KB)每个 WAL 日志文件 = 一个 段(segment)题目中选项为kb,个人认为不够严谨。
2025-07-28 11:36:25
265
原创 RAID盘加完怎么用?手把手教你格式化与挂载
当我们磁盘已经插入并完成 RAID 配置后,接下来需要格式化并挂载后才能正常使用假设 RAID 卡已经将虚拟磁盘映射为/dev/sdX(例如/dev/sdelsblk。
2025-07-04 11:24:28
617
原创 VMware安装Ubuntu22.04详细教程
处理器内核总数 = 处理器数量 X 每个处理器的内核数量;虚拟机处理器内核总数小于或等于(<=)CPU实际线程数;给这个虚拟机起一个,选择数据保存位置。根据自己电脑cpu配置来分配;使用网络地址转换(NET)选择字体,安装Ubuntu。选择I/O控制器类型。选择下载的ISO镜像。
2025-06-23 20:57:01
854
原创 什么是 CSSD?
是 Oracle Clusterware 中最核心、最关键的后台进程之一,运行在每个 Oracle RAC 节点上。CSSD 是 Oracle RAC 中专门用来判断节点存活状态的核心进程,一旦检测到自己失去与其他节点通信或无法访问 Voting Disk,就会主动触发节点重启,以保证集群一致性、防止脑裂。
2025-03-31 16:45:00
1765
原创 InfiniBand (IB)和 以太网 的区别
InfiniBand(IB)是一种专为高性能计算(HPC)设计的网络技术,提供极高带宽、超低延迟和 RDMA(远程直接内存访问)功能。超算集群(如天河、神威)云计算高性能节点数据中心的存储网络InfiniBand 是一种“速度极致”的高性能网络,它在 Oracle RAC 中承担心跳和缓存同步等关键任务,但也极度依赖物理连接质量,任何微小抖动都可能导致整个节点被踢出集群。
2025-03-31 15:30:00
2865
原创 什么是 Voting Disk以及它在 RAC 中的作用
Voting Disk(投票盘)是 Oracle RAC 中用于判断集群节点存活状态的重要组件,它是一个共享磁盘文件,所有节点都必须能够访问它。你可以把它理解成集群的“点名册”或“签到表”。Voting Disk 是 Oracle RAC 的核心裁判和判断节点生死的“选票中心”,配合 CSSD 使用,在网络异常或节点异常时起到决定性的作用,防止脑裂、保障集群一致性。
2025-03-31 14:45:00
1191
原创 在银河麒麟上安装Ollama详细流程
在银河麒麟系统中安装ollama时会报错:原因是系统中的 libstdc++ 版本太旧,缺少 GLIBCXX_3.4.25。可以先用检查当前版本支持哪些 GLIBCXX,看到的最大版本小于 GLIBCXX_3.4.25,那就说明需要升级。由于 Kylin 的软件源不包含最新版本的 libstdc++,需要手动下载并安装。但是直接替换系统库可能导致系统不稳定,所以建议谨慎操作并备份重要数据。
2025-03-31 11:32:09
3773
原创 什么是心跳(Heartbeat)?它有多重要?
在 Oracle RAC 中,“心跳”是一种节点之间互相确认“我还活着”的机制。可以把它理解成:A :“我还在,你呢?B: “我也还在!每个节点会定期发送“心跳消息”到其他节点,如果某个节点在指定时间内没有回应心跳,就会被认为可能已经死机或断网。
2025-03-31 10:24:57
707
原创 Oracle RAC 架构核心组件详解(入门学习笔记)
负责把集群事件广播出去,比如“谁上线了”、“谁死了”、“VIP 漂移了”等等。ASM 类似于数据库专用的“软件 RAID + LVM”。Voting Disk 的健康状态决定了集群是否继续运行。存储集群中的配置信息(相当于“集群的注册表”)节点之间用来“传心跳”和“同步缓存”的网络。负责维护节点间的“心跳”和集群一致性。Oracle 提供的专用存储管理系统。CSSD 用它来决定谁活着,谁死了。,所有节点可以并发处理请求。指的是共享在多节点之间的。管理整个集群的资源状态。
2025-03-31 09:25:52
1431
原创 记录一次Dell服务器更换内存条报错解决过程No memory found
一些服务器主板要求内存必须按照特定顺序插槽(比如A1、B1先插),否则无法识别。但具体也要根据自己服务器来做相应的调整。
2025-03-26 11:04:16
3488
原创 数据库故障排查流程
AWR “SQL Ordered by Elapsed Time”,确定最慢 SQL。检查系统日志(alert.log)是否有 ORA-04031(内存不足)等错误。高 CPU 消耗(DB CPU) → SQL 优化。高并发等待(锁/资源管理) → 事务或并发控制优化。高 IO 等待 → 磁盘存储或 SQL 访问优化。调整 PGA 限制、优化 SQL、批量处理。监控告警:CPU/内存/IO 资源告警?监控主机 CPU、内存、IO 是否超载。IO 负载:是否磁盘 IOPS 受限?CPU 负载:是否过载?
2025-03-20 11:03:37
562
原创 RAID0、RAID1、RAID5、RAID10、RAID50
在 Oracle 19c RAC 集群中,RAID(独立磁盘冗余阵列) 是提高存储性能、数据保护和可用性的关键技术。不同的RAID级别适用于不同的应用场景。Oracle生产数据库推荐RAID 10(事务数据库)或RAID 50(大数据存储)。SSD适合RAID 1/RAID 10,高速存储日志文件。SAS适合RAID 5/RAID 50,存储数据文件和归档日志。
2025-02-13 10:56:23
1716
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅