ORACLE RAC+ASM
文章平均质量分 91
喜欢就点个订阅吧
富士康质检员张全蛋
人生实难,唯有自渡。只有接受了真实现的现状和真实的自己,调整好心态,才能脚踏实地的活着,然后去发现角落处的那些惊喜和美好,去相信一切苦难困境都会过去!“即使身处阴沟,也要记得仰望星空”。
展开
-
RAC 一次掉盘导致集群故障
业务反馈,两台主机上面的数据库都宕机了,采用的存储是数据文件方式,不是ASM。上去先查看集群状态。[grid@cxcsdb01 ~]$ crsctl stat res -t -init --可以看到集群管理的资源状态都是offline状态。-------------------------------------------------------------------------...原创 2018-10-18 15:36:54 · 811 阅读 · 0 评论 -
Oracle Huge Pages,Transparent Huge Pages
写在前言在Linux中大页分为两种:Huge pages (标准大页)和 Transparent Huge pages(透明大页)。内存是以块即页的方式进行管理的,当前大部分系统默认的页大小为4096 bytes即4K。1MB内存等于256页;1GB内存等于256000页。CPU拥有内置的内存管理单元,包含这些页面的列表,每个页面通过页表条目引用。当内存越来越大的时候,CPU需要管理这...转载 2018-10-09 10:51:04 · 707 阅读 · 0 评论 -
RAC CHM
读书笔记: CHMCHM(cluster health monitor)是Oracle提供的一款工具,用来收集操作系统的资源(CPU,内存,SWAP,进程,I/O以及网络等)的统计信息。从11.2.0.2版本开始,CHM会以初始化资源ora.crf的形式存在集群的每一个节点上。例如:[grid@RAC1 ~]$ crsctl stat res -t -init---------...原创 2018-09-30 11:20:17 · 476 阅读 · 0 评论 -
RAC DRM导致Oracle RAC节点Hang住
生活就像一盒巧克力,你永远不知道下一颗是什么味道。--《阿甘正传》在DBA的世界里,数据库的新特性就是这样一盒巧克力,可能是惊喜也可能是坑。毋庸置疑,新特性总是伴随着新功能而来,然而在企业最核心的数据资产面前,某些新功能的出现所带来的好处,远远不及其对于性能和稳定性带来的危害。因此我们常常会选择禁用一些新特性,今天要分享的DRM就属于其中一个。为什么DRM通常会被列入禁用的名单,今天我...转载 2018-09-26 16:39:37 · 1311 阅读 · 0 评论 -
RAC 添加监听,静态注册监听
非默认端口添加监听静态注册服务网上一大堆博客说如何在RAC环境中添加非默认1521端口监听的,并且静态注册服务,眼花缭乱,而且好多不靠谱,最近工作当中要求为生产库上面的一套RAC添加监听,端口为1522,即非默认1521端口,并且使用静态注册服务到监听当中。由于我在生产环境上添加监听了,并且使用pl/sql工具测试了是可以正常连接的,下面是自己虚拟机上面还原这个过程,其实和生产...原创 2018-09-14 11:40:58 · 3696 阅读 · 0 评论 -
RAC 主机内存条故障导致的一个节点重启
今天业务反馈有一台主机登入不上去,环境是RAC,只有一个节点重启了,另外一个节点正常。我同事比我先处理一段时间,导致了ocssd.log里面的日志没有拿下来(ohasd.log,ocssd.log这些日志产生的日志量比较大,不像DB的alter日志,当ocssd.log日志是会覆盖的,假设你9:00集群宕机的,当你10:00再去看日志会发现里面日志没有9:00日志了,都是最近的日志,这也是我为什么...原创 2018-09-12 15:16:16 · 2620 阅读 · 0 评论 -
RAC 各种日志位置
11GR2 rac 中要关注的日志及其路径 DB日志oracle 下的alert日志$ORACLE_BASE/diag/rdbms/orcl/orcl1/trace/alertorcl1.log 集群相关日志grid 下的 alert 日志 $ORACLE_HOME/log/rac1/alertrac1.logcss的日志$ORACLE_HOME/log/rac1/cs...原创 2018-09-12 10:57:55 · 3533 阅读 · 0 评论 -
RAC misscount
提到OCSSD 这个进程是Clusterware最关键的进程,如果这个进程出现异常,会导致系统重启,这个进程提供CSS(Cluster Synchronization Service)服务。 CSS 服务通过多种心跳机制实时监控集群状态,提供脑裂保护等基础集群服务功能。 CSS 服务有2种心跳机制: 一种是通过私有网络的Network Heartbeat,另一种是通...原创 2018-09-07 10:16:20 · 380 阅读 · 0 评论 -
Oracle 11g Rac rman把本地数据文件迁移到ASM
随笔Oracle 10G这个版本,ORACLE推出了自己的集群管理软件-CRS(cluster ready service),换句话说呢就是ORACLE从10G开始提供数据库层面和操作系统层面的集群产品。CRS作为集群层面的软件,在每一个节点上面运行,主要有两个作用:(1)完成构建集群,当有节点加入或者离开时维护集群的一致性 (2)管理集群当中的资源,比如负责资源的启...原创 2018-08-22 15:12:22 · 450 阅读 · 0 评论 -
RAC DRM
这边RAC库的入网检查有这么一项:关闭RAC的DRM功能,查看DRM相关参数输出为0。select a.ksppinm, b.ksppstvl --查看是否关闭DRM功能,如果没有关闭则需要关闭。 from sys.x$ksppi a, sys.x$ksppcv b where a.indx = b.indx and a.ksppinm in ('_gc_policy_time'...原创 2018-08-16 22:14:34 · 626 阅读 · 0 评论 -
RAC Cache Fusion 内存融合详解
1.内存融合相关概念▸ 在RAC环境中,实现多节点对数据的并发访问和修改的⼀种机制。▸ Cache Fusion的要点1、⾼速私有⽹络2、共享存储3、节点间的访问机制 --通过这三个特点实现了内存融合 如果多个节点对数据块进行修改,很难保证谁修改的是最新的,那么oracle通过scn,来通过scn保证数据的不同版本,scn被引入到了内存融合当中,那么多个节点在访问的时候,看起来多...原创 2018-08-08 21:21:19 · 3890 阅读 · 0 评论 -
RAC MISSCOUNT
提到OCSSD 这个进程是Clusterware最关键的进程,如果这个进程出现异常,会导致系统重启,这个进程提供CSS(Cluster Synchronization Service)服务。 CSS 服务通过多种心跳机制实时监控集群状态,提供脑裂保护等基础集群服务功能。 CSS 服务有2种心跳机制: 一种是通过私有网络的Network Heartbeat,另一种是通过Vot...转载 2018-08-06 11:10:46 · 608 阅读 · 0 评论 -
RAC heartbeat 心跳机制
世界上最遥远的距离,不是生与死。而是我们同一个集群的两个节点,你却听不到我的心跳。必要性:维持集群的⼀致性RAC⼼跳机制 – 集群⼼跳基本机制:1、确定节点和节点间的连通性,达到彼此了解2、⽤共享的位置保持节点的连通信息,及时记录和更新3、本地节点的⾃我监控 (保证自己是可以对外提供服务的,正常运行的。如果能够自我监控,在自己遇到问题的时候能够自己处理,这样就可以更好的把握节点的一致性...原创 2018-07-23 23:18:43 · 5261 阅读 · 0 评论 -
RAC 节点参数不一致引发的悲剧
编辑手记:在Oracle RAC中,有一些参数是数据库级别的,所有实例都使用同一个参数值,有些参数是实例级别的,实例间可以设置不一样的值。然而,对于部分实例级别的参数,节点间设置不同却可能引发故障。对于数据库参数的检测非常细致,根据参数对于数据库的影响大小,可以分为:性能类参数,稳定性类参数及规范操作类参数。在我们诊断过程中,发现大部分人在参数的配置上比较随意。最常见的问题包括以下一些:...转载 2018-07-22 18:05:34 · 2792 阅读 · 0 评论 -
Oracle-揭开RAC神秘面纱
集群就是多个节点当做一个系统对外提供服务。集群的分类1、根据功能特点划分⾼可⽤集群高可用集群可以分为两类:一种是hot failover和cold failover,区别是hot failover是指多个节点处于active的状态,同时对外提供服务。cold failover是指主备模式。Rac是属于hot failover模式。负载均衡集群通过多个节点来分担系统的负载,均衡负...原创 2018-07-19 21:24:03 · 1232 阅读 · 0 评论 -
RAC-OCR和Vote Disk简单操作
OCR磁盘的备份和恢复Voting Disk和OCR磁盘直接关联到CRS是否可以启动,那么就需要有备份和恢复的方式。ocrconfig---OCR磁盘的管理工具OCR的备份– [root@rac1 bin]# ./ocrconfig -export /u01/ocr.expOCR的恢复– ./ocrconfig -import /u01/ocr.exp 上面是将OCR磁盘的信息以文件的形式导出。导...原创 2018-07-15 11:41:21 · 945 阅读 · 0 评论 -
RAC-OCR的备份和恢复
Oracle Clusterware把整个集群的配置信息放在共享存储上,这些信息包括了集群节点的列表、集群数据库实例到节点的映射以及CRS应用程序资源信息。也即是存放在ocr 磁盘(或者ocfs文件)上。因此对于这个配置文件的重要性是不言而喻的。任意使得ocr配置发生变化的操作在操作之间或之后都建议立即备份ocr。本文主要基于Oracle 10g RAC环境描述OCR的备份与恢复。...转载 2018-07-15 11:20:37 · 496 阅读 · 0 评论 -
RAC-添加磁盘不当导致的故障
最近一个生产库挂了,通过后台日志分析截图如下:数据库挂了的原因是因为数据库的文件系统对应的磁盘全部掉了,但是看到后台日志ORA-00204这个错误,还是百度了一下看到杨长老的文章,于是收入到自己博客,下面的故障时在RAC下面添加磁盘不当导致数据库宕了。这是一则生产环境的真实维护过程,由于RAC的测试环境空间不足,因此规划给ASM扩展空间,然而在给ASM添加新的磁盘空间时又出现了故障,这类问题在很多...转载 2018-06-28 15:53:48 · 785 阅读 · 0 评论 -
RAC-脑裂
RAC的脑裂问题--EVICTION当由于网络问题,RAC的节点间无法进行通信时,出现脑裂问题,RAC必须通过驱逐其中的一部分节点来保护数据的一致性,被驱逐的节点将被强制重启。当节点间无法探知对方的网络心跳时,必须通过voting disk来决定驱逐那个节点。脑裂问题可能出现在2个层面– 集群层– 实例层 一旦实例的内连网中断,即interconnect。两个实例之间都能正常工作,只是内连网断了。...原创 2018-06-26 22:22:07 · 4331 阅读 · 0 评论 -
RAC-故障处理
RAC的故障定位比单节点数据库更复杂– 相关的进程更多– 日志的存储位置更多– 日志的信息量更大– 故障更复杂RAC的核心进程,cssd,crsd。这两个进程出现问题,那么RAC就宕了。RAC比单实例数据库进程要复杂的多。RAC日志存放的位置也多,种类也多,相对于单实例。对于单实例数据库,所有的关于数据库的信息几乎都放在alter日志文件里面,包括数据库的故障,实例级别和数据库级别故障。下面就是单...原创 2018-06-24 22:32:36 · 1096 阅读 · 0 评论 -
RAC-GCS等待事件
GCS相关的等待事件数据块相关的等待事件– gc current block 2-way– gc current block 3-way– gc cr block 2-way– gc cr block 3-way 如果你看到很多数据块相关的等待事件,说明之间有许多数据块在之间传递。主要是节点之间相同的数据块请求比较大。current是指当前模式去修改一个数据块,2 way和3 way是指要跳几个节...原创 2018-06-06 21:46:56 · 2328 阅读 · 0 评论 -
RAC-Spfile和Pfile转换注意事项
注意:大家在维护RAC环境是,请不要轻易使用“create pfile from spfile;”命令创建PFILE文件。 原因是这样的,在RAC环境,SPFILE默认情况下会存放在共享存储上(裸设备或ASM磁盘组上),RAC的每个节点都是使用PFILE指向SPFILE的方法来完成SPFILE的定位的。即pfile文件中存放的是spfile的路径。 如: [Oracle@rac1]#cat /or...转载 2018-06-02 15:12:11 · 1374 阅读 · 0 评论 -
RAC-GC Read Block
LMSn-- Lock Monitor Servicesu LMS进程主要用来管理集群内数据块的访问,并在不同实例的BUFFER CACHE中传输块镜像。u 当在某个数据块上发生一致性读时,LMS负责回滚该数据块,并将它copy到请求的实例上。u 每个RAC节点至少有2个LMS进程。u 也称作 GCS (Global Cache Services) processes. GC Read Comm...原创 2018-05-29 20:30:38 · 440 阅读 · 0 评论 -
RAC-OCR,VIP,VOTEING DISK
RAC的其它组成部分 VIP - 虚拟IP地址(Virtual IP)OCR - Oracle Cluster Registry(集群注册文件),记录每个节点的相关信息Voting Disk - (表决磁盘) 仲裁机制用于仲裁多个节点向共享节点同时写的行这样做是为了避免发生冲突。 什么是 VIP? 是一个虚拟的IP,绑定在某个物理网卡上。 应用使用VIP进行连接。 如果RAC某节点down掉,它的...原创 2018-05-21 21:27:31 · 516 阅读 · 0 评论 -
RAC-Cache Fusion内存融合
RAC最核心复杂的一个功能是cache fusion,内存融合机制。通过内存融合将两个实例的内存融合到一起,感觉就像一个内存一样。就是通过锁的机制保持几个实例的内存相互通信。无数据传输模式的读取无数据传输模式的读取就是一个实例要读取数据块,数据块不是在其他实例的内存上,而是在一个磁盘上面,无传输就是指不需要从一个实例到另外一个实例上面。实例2要读取一个数据块的时候,在RAC模式下面,每次去请求一个...原创 2018-05-21 11:45:00 · 1469 阅读 · 0 评论 -
RAC 关闭透明大页
在移动进行数据库进行规范检查的时候有这么一项 ,要求系统关闭透明大页 。 为什么要关闭透明大页? 透明巨大页面的一些官方介绍资料:透明超大页面(THP)在RHEL 6中默认情况下对所有应用程序都是启用的。内核试图尽可能分配巨大的页面,如果mmap区域自然对齐2MB,任何Linux进程都会收到2MB页面。主内核地址空间本身被映射为巨大的页面,减少了内核代码的TLB压力。关于Hugepa...转载 2018-04-04 15:20:31 · 1377 阅读 · 0 评论 -
Oracle RAC原理
单点数据库VS RAC单节点数据库,如果实例宕机了,如果一个业务链接在实例上面,那么这个业务就中断了。这个时候系统就不具有可用性了,那么这个时候单节点的可用性是很差的。对于RAC来说,和单实例一样,还是一份数据文件,都是相同的存储上面放着oracle的文件,但是是由三个实例共用同一份数据文件。这样的好处是在三个实例之间做了冗余,在上面三个实例当中任意两个坏了业务都可以链接到剩下的一......原创 2018-01-08 11:52:19 · 114587 阅读 · 4 评论 -
RAC Central Inventory
读书笔记 由于Oracle支持将多个Oracle软件(或者多版本的数据库软件)安装到同一台服务器上面,这就需要一个位置统一记录安装的软件信息。中央目录(central inventory)实际上就是一台主机上面安装的Oracle产品的清单,这个清单里面记录了每一个Oracle软件的主目录的名称和位置,安装的组件,以及一些其他的信息。 OUI在安装产品时候会读取中央目录来确定已经安装...原创 2018-10-13 11:25:18 · 281 阅读 · 0 评论 -
RAC root.sh
读书笔记:(这篇文章太长了,还是建议读者复制到自己word文档里面去看,root.sh这个脚本很重要,是在安装RAC的时候的核心。) root.sh脚本root.sh脚本可以说是安装集群管理软件过程当中最重要的,同时也是最容易出问题的,这个脚本要完成对集群的初始化和很多配置任务。 1.root.sh脚本root.sh脚本:(root.sh脚本位置/u01/app/11.2....原创 2018-09-17 22:38:19 · 1553 阅读 · 0 评论 -
RAC 安装用户组和权限设置
读书笔记 从11gR2开始,Oracle推荐使用不同的操作系统用户安装GI和数据库软件,例如,使用grid安装GI,使用Oracle安装数据库软件,当然,用户还是可以使用Oracle用户安装GI和数据库软件,同时从11gR2版本开始,ASM作为GI的一部分安装,ASM软件是负责创建和管理磁盘组的,Oracle数据库软件需要访问保存在ASM磁盘组上面的数据文件和其他文件,现在这两部分软件是使...原创 2018-09-05 14:50:01 · 1883 阅读 · 0 评论 -
RAC HAIP
NOTE: HAIP(ohasd管理的资源)对于 oracle集群,私网通信是非常重要的,因为节点和节点之间的通信绝大部分都是要通过私网来实现的,私网通信基本上可以分为两种:第一种是集群层面之间的通信:第二种是数据库实例之间的通信。 第一种通信(例如:节点间的网络心跳)主要特点是持续存在,实时性要求高,是数据量比较小,所以通过TCP/IP协议传递就可以了。 第...原创 2018-12-26 17:07:12 · 1470 阅读 · 0 评论 -
RAC OLR
NOTE: 11GR2版本:从11GR2版本开始,ohasd成为了集群启动的唯一起始点,而所有的其他守护进程和集群管理的资源都定为资源,例如:cssd守护进程以初始化资源ora.cssdd的形式存在,而ohasd守护进程负责管理集群所有的守护进程对应的资源,同时集群管理软件(GI)不再使用racg模块来管理资源,而是使用代理进程(agent)统一实现对所有资源进行管理。既然一切都变...原创 2018-12-21 17:18:16 · 755 阅读 · 0 评论 -
RAC 11GR2 集群启动脚本
读书笔记: 11GR2版本来看看11GR2版本集群的/etc/inittab文件。#run xdm in runlevel 5x:5:respawn:/etc/X11/perfdm -nodaemonh1:35:respawn:/etc/init.d/init.ohasd run >/dev/null 只有脚本/etc/init.d/init.ohasd被调用...原创 2018-10-30 09:44:35 · 412 阅读 · 0 评论 -
RAC共享磁盘物理路径故障导致OCR、Votedisk所在ASM磁盘组不可访问的案例分析
客户的环境是两台IBM X3850,安装Oracle Linux 6.x x86_64bit的操作系统部署的Oracle 11.2.0.4.0 RAC Database,共享存储是EMC,使用了EMC vplex虚拟化软件对存储做了镜像保护,操作系统安装了EMC原生的多路径软件。故障的现象是当vplex内部发生切换时,RAC其中一个节点的OCR和Votedisk所在的磁盘组变得不可访问,导致o...转载 2018-09-04 15:42:49 · 3129 阅读 · 0 评论 -
ASM _asm_hbeatiowait
最近一个数据库节点的集群宕了,但是数据库正常,节点没有被踢出集群,下面是ASM记录的日志。 WARNING: Waited 391 secs for write IO to PST disk 0 in group 2.WARNING: Waited 391 secs for write IO to PST disk 0 in group 2.Fri Aug 31 09:49:27 ...转载 2018-09-04 11:11:47 · 4927 阅读 · 0 评论 -
Oracle-文件系统迁移到ASM
一) 在linux里增加1个8G的虚盘 /dev/sdb,8G, 分6个区,每个区1024M,分别对应sdb1,sdb2,sdb3,sdb4(逻辑扩展),sdb5,sdb6,sdb7。# fdisk -lDisk /dev/sda: 32.2 GB, 32212254720 bytes255 heads, 63 sectors/track, 3916原创 2018-05-07 14:51:47 · 1396 阅读 · 0 评论 -
Oracle-ASM单实例数据库安装
oracle enterprise linux 6.4+oracle 11.2.0.4 单实例+ASM 部署手册一、 主机准备ip:192.168.100.100主机名: oracle 11g目录: /u01磁盘: 35G 本地磁盘一个, 另外再分块 16G 磁盘1.1 检查主机名和 IP 地址的映射: hostname -ivi /etc/sysconfig/networkN...原创 2018-03-31 12:23:37 · 2038 阅读 · 1 评论 -
Oracle-ASM实例管理
Oracle文件系统的历史 操作系统--逻辑卷管理器(LVM)管理文件相对容易,性能较差裸设备管理文件相对困难,性能好ASMASM是ORACLE数据库文件支持的卷管理ASM磁盘组里面只能存放Oracle数据库文件:数据文件、联机重做日志文件、控制文件等OCFS(Oracle Cluster File System)是ORACLE数据库文件系统原创 2018-03-27 17:48:32 · 7580 阅读 · 1 评论 -
RAC 资源分配
RAC下用户资源的分配:下面是实际生产环境下给准备上线的业务的分配资源。 (1)创建操作系统下面用来expdp导数据的目录,确保这个目录所在的磁盘有足够的空间。[root@RAC1 ~]# mkdir -p /archive/dumpdir/zc[root@RAC1 ~]# chown -R oracle:oracle /archive/dumpdir/zcchown:...原创 2018-10-22 16:15:05 · 1543 阅读 · 0 评论 -
RAC 修改IP地址
修改RAC环境下IP是一个同事在移动的生产环境上面做过的 我把其整理一下 在自己虚拟机上重新做了一遍以下这些在生产库上也可以做 RAC中网络管理层oifconfig命令: 操作系统:Oracle Linux 6.5数据库版本:11.2.0.4目标:修改前/etc/hosts配置[root@RAC1 ~]# cat /etc/hosts127...原创 2018-06-19 15:55:52 · 1085 阅读 · 0 评论