自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

sunrise运维笔记

一些关于个人问题处理以及技术学习过程中的记录。

  • 博客(39)
  • 收藏
  • 关注

原创 nbu vault出库比较快

故障现象:客户在某天正常完成NBU磁带出库后,过了3天后再进行出库,发现vault的速度特别慢,但是提示没有任何报错。故障背景:客户备份设备出问题,暂时停掉了备份,客户之前vault出库是正常的。相关日志如下:2021-7-618:09:49-vaultwaitingforgloballock2021-7-618:09:49-requestingresourcenbuser.NBVAULT.MAXJOBS2021-7-618:09:51-vault...

2021-07-14 19:29:53 419

原创 vmware VCPU的一点理解记录

最近在重新看vsphere 的一些东西,在看有关VMware规划设计方面,对vcpu的理解不是很透彻,记录一下:根据vmware官方文档的说明:(v)

2021-06-02 15:56:52 2548

原创 nbu客户端访问java console 7656

故障描述:nbu 服务器自己访问java console正常可以调出nbu界面,普通的客户端无法访问服务端故障原因:the Certificate Revocation List (CRL) because the CRL expired故障解决办法:通过help信息,提示nbcertcmd -getCRL,来解决。但很多时候我们发现这条命令解决不了问题。根据原因: 客户端和master服务端时间差距过大导致,往往原因在于刚部署nbu master 服务器时,忽略了本机的时间,然后默认下一.

2021-05-06 14:40:45 686

原创 nbu8.X 备份oracle部署普通client方法及注意事项

说明:NBU 8.X 版本后,服务端以及客户端通讯方法追加了证书认证这一块,在部署过程中,有一些地方需要注意,以下一些说明:1.不同的客户环境,对网络访问会有不同的权限,在部署客户端软件时,首先需要向客户网络运维人员申请网络访问权限:NBU master 和普通客户端 之间 1556 13724 13782 必须保证这3个端口之间双向开通,只要这个开通,网络通讯方面就不会有什么问题。2. linux环境注意检查本地防火墙策略,redhat7以上版本注意firewalld 服务,redhat7..

2021-04-21 00:02:30 1171

原创 hp storeonce 项目实施的一些记录

最近项目在实施 一个NBU的备份项目,客户环境备份设备为新采购的HP 5200系列的虚拟带库,在此记录项目实施过程中NAS遇到的一些问题( 0 ) storeonce在设备进行初始化时,进展很不顺利,远程访问口,以及端口遇到问题,通过hp 二线工程师支持,并且重算root 口令,hp 工程师进行一些底层处理后,问题解决,但是初始化完后,后续进展特别顺利,目前也没理解设备初始化过程中的那些幺蛾子为什么会出现。(1) HP 5200 虽然有NAS功能,但是仅有最基本的网络访问权限以及相关设置...

2021-04-06 23:29:11 872

原创 aix gcc go环境遇到的问题

# rpm -e gcc-go-7.2.0-6.aix6.1.ppc.rpmerror: package gcc-go-7.2.0-6.aix6.1.ppc.rpm is not installed# rpm -ivh gcc-go*package gcc-go-7.2.0-6 is already installed# rpm -ivh gcc-cpp*package gcc-cpp-7.2.0-6 is already installed# rpm -e gcc-go-7.2.0-6.aix

2021-03-16 20:44:12 640

原创 powervc AEVIMG025E pool_total_capacity_gb of undefined 报错

故障描述:通过ibm powervc 部署虚拟机,点击映像无法虚拟机报错。提示信息“AEVIMG025E pool_total_capacity_gb of undefined”。故障排除:根据直观信息powervc取不到存储池相关信息。通过powervc查看接管的IBM 存储,通过确认,底层存储池发生改变,导致原有存储器模板失效。临时解决方法:1.通过之前已经建立的虚拟机,确定原来迅疾存储器模板中的池名称。 2.后台IBM 存储进行存储卷名...

2021-02-22 20:13:15 174

原创 nbu备份文件失败,提示信息NBU status: 2074, EMM status: Disk volume is down

NBU 作为一款很成熟的备份工具,支持多种类型的备份,备份文件可以存储在普通的磁盘、磁带、物理带库、虚拟带库、MSDP以及OST类型的重删池。本次只是拿一简单的备份,说明,在NBU处理故障中,可能会遇到的一种情况。本例:通过NBU备份普通的文件,测试客户端和NBU master通信以及能否正常备份。当然NBU 客户端和MASTER通信在有防火墙的情况下,需要开通一些端口,在仅就不展开进行了说明。如下:通过NBU master 进行 storget unit,也就是说创建一个普通的备份介质,本地磁

2021-01-21 16:10:18 2776

原创 AIX 克隆系统后需要注意的一些问题

在实施小机项目过程中,针对客户多环境,多应用的需求,我们往往会通过AIX克隆的技术,来提高AIX系统装机速度,从而提升效率。虽然克隆技术的确很方面,但是有些问题,值得关注。以下是个人最近实施浪潮K1 S924项目中一些问题记录:1.关于bootlist启动项问题,虽然厂商工程师说的是根据AIX启动提示会进行自动追加bootlist操作项,按1时,会自动添加bootlist启动项如下所示:---------------------------------------------------

2020-12-08 13:57:46 343

原创 NBU oracle 异机恢复 socket read failed

备份环境描述:恢复某生产某库,原机通过 自身走LANFREE备份.源端: testdb (media server)目标客户端:hfyzdb (client) pnbumedia 为mediaserver故障描述:NBU 异地恢复ORACLE,bplist无法获取备份内容. 报exit status 23:socket read failed故障排查过程:1. 根据报错代码,网络进行测试,master和客户端相互ping 1556 13724 13782,端口通信正常...

2020-11-14 12:12:45 788

原创 NBU lanfree备份初始化带库配置, mediaserver 无法找到,报globaldb hostname has not been set

故障场景: 在利用NBU进行数据库备份时,在安装media server客户端安装后,media server 提示安装正常.通过NBU 管理控制台client端以及media server配置端并未无法media server的信息。但是通过bpps -x服务,确定,NBU服务均正常。在NBU端进行带库设置过程中,并未注意点这点,尤其客户备份环境中,media server 比较多,且配置过程中有备份任务正在进行,结果,等了半个小时才出现media 的扫描信息(media 信息在此省略)但是扫

2020-10-11 22:17:43 870 1

原创 AIX7.2 装完系统后,smitty使用特别慢

故障背景:AIX7.2系统部署后, smit使用使用特别慢,底层存储后台有远程拷贝动作.通过NMON以及使用smitty 工具命令反应特别慢.初步排查思路:1.底层存储有同步动作,占用了大量IO.但是nmon命令掉出后,通过 查看hdisk的繁忙程度,并未有特别大的读写操作.磁盘IO比较先.2.分析hosts文件,查看是否有多余解析.未有多余IP和 hostname的解析对应关系.排除hosts文件问题.3.查看AIX 解析记录顺序文件,并未有人工更改.编辑etc/netsvc.conf

2020-09-22 20:30:55 430

原创 MHA配置文件主库binlog路径不正常导致复制状态监测失败

最近研究完MHA,搭建完之后切换一切均正常,但是因为一个节点端口以及路径跟其他两个节点设置的不一样,导致最终切换失败。之前排查问题只看到了error这个关键字,并没有留意错误信息其实已经在info 里面提示了。通过反复验证,也对MHA的配置文件有了更深的理解。master_binlog_dir=/usr/local/mysql/datamaster_ip_failover_script=/usr/local/bin/master_ip_failover由于各个库 binlog路径设置不同,导致

2020-08-16 12:38:33 2104

原创 MYSQL主从复制,从库只读设置

最近在研究MYSQL数据库,对比之前的ORACLE数据库,真的觉得很多技术都是相通的。研究了一段MYSQL,突然觉得之前ORACLE学习过程中遇到的一些问题,也有了一定的处理思路。个人觉得MYSQL比ORACLE的学习可能更简单一些。当然对于DBA而言,永远都得胆大心细,更得对生产环境永远有敬畏之心。-------------------------------------------------------------------------------------------------------

2020-07-25 22:19:44 1378

原创 zabbix监控项不支持的几种变通处理思路

在平时我们部署zabbix过程中,我们经常会做一些模板导入的操作,然后基于官方或者别人所写的监控项,然后再做修改和更新.往往会忽视对zabbix版本的要求,经常会看到一些监控项不支持的情况,当然监控项不支持的原因有很多,在这里面,只是记录一下个人的处理方法:1.尝试将模板导入高版本或者低版本的zabbix中看是否还有相同错误.或者尝试修改xml 文件的模板版本信息看是否还报错.2.通过zabbix_get 命令去尝试获取监控项的信息,如果有返回数据,仔细查看监控项的内容或者值的类型是否错误,更新监控

2020-06-23 22:34:09 4037

原创 vsphere虚拟机添加IP后,地址不生效的几种排查思路

症状描述:在vsphere平台上通过新的centos7新镜像,创建虚拟机后,IP地址始终不生效。排查思路:1.检查防火墙配置。systemctl status firewalld 2.检查NetworkManager 服务是否启动,尝试关闭此服务,并重启网络服务,确认地址是否生效. 3.重启网络服务systemctl restart network 4.检查网卡配置文件/etc/sysco...

2020-05-25 19:09:40 2581

原创 一次小机网卡故障的处理过程

环境描述:两台小机,一台修改IP地址不生效,另一台正常。为便于分辨,以aix52和aix56 做为区别,两台小机通过HMC进行管理。故障描述:aix56 小机smitty 修改IP地址不生效。故障处理过程:1.通过主机层面以及HMC分别查看错误日志,无硬件报错。2.主机层面通过lsdev -Cc adapter 过滤查看,网卡是否正常# lsdev -Cc adapter...

2020-04-03 09:00:08 564

原创 harbor 私有仓库访问过程中几种报错问题处理

harbor的搭建过程本篇不做描述,请查看网上相关文档,本篇主要是长时间没操作docker,对客户端访问harbor过程中遇到的问题,做一些总结。1.问题一:push镜像denied ,报错如下:[root@moban harbor]# docker push hub.runsise.com/test/test_centos:1.2The push refers to repositor...

2020-03-12 17:02:58 4066

原创 overlay网络创建成功后,跨宿主机容器内部通信不通

1.环境介绍:两台宿主机 os:centos7.4 和centos7.6kernel内核均为:3.10IP地址: 192.168.20.11\192.168.20.23consul server地址:192.168.20.112.通过consul方式构建overlay 网络,方法网络很多,因为最终结果为成功,就不说明了,主要是为了记录几次排错尝试3.故障现象描述:...

2020-01-15 14:07:14 2642 1

原创 aix 6.1早期版本默认网关设置未生效引起的网络不可达

习惯了通过smitty tcpip设置AIX网络信息, 其中 黑色加粗部分是网关的设置的地方,抽空测试了一把6100-01这个版本的操作系统,通过安装发现,AIX 后期的每个版本的确有些地方做了不少调整,受惯性思维,很多地方未认真检查。装完系统后,设置IP地址后,发现 同网段可以ping 通小机,跨网段不通。 ...

2019-12-19 21:27:36 615

原创 zabbix故障处理5-selinux问题

现象:用rpm包方式安装zabbix 4.4,在最后一步启动zabbix服务时候,无法启动。报错如下:[root@f5 ~]# systemctl status zabbix-server● zabbix-server.service - Zabbix Server Loaded: loaded (/usr/lib/systemd/system/zabbix-server.servic...

2019-11-27 21:08:17 1242

原创 AIX SMS调整硬盘启动顺序

现象:AIX进入诊断模式,无法正常登陆系统如下图所示:解决方法:1. 通过SMS菜单调整硬盘启动顺序,M = return to Main MenuESC key = return to previous screen X = eXit System Management Services--------------------------------...

2019-10-09 19:34:06 2111

原创 ftp yum 安装软件报错FTP Error 550 - Server denied you to change to the given directory

yum 源主要为了帮助我们解决在linux平台上,软件之间相互依赖的问题,有在线和离线YUM多种方式。有时候挡在客户现场无法进行联网时,需要部署离线yum 源。离线YUM包可以通过操作系统光盘,HTTP和FTP几种方式。本篇主要给大家解决通过FTP方式部署离线YUM时遇到一个小问题,希望对遇到此类问题的朋友给一些帮助。FTP搭建YUM 比较简单,以ftp部署centos7操作系统离线yum为例...

2019-09-28 18:37:17 12481 3

原创 zabbix odbc方式监控oracle 数据库Data source name not found报错处理

zabbix监控ORACLE数据库的方式网上比较多的,大多采用orabbix插件来对数据库进行监控。本篇主要对通过ODBC方式监控ORACLE数据库中遇到一个坑做一下记录。采用ODBC方式比较简单,但是需要在每台数据库创建监控账号并赋予相关读写权限,本篇主要对如下问题的一个解决处理处理:root@monitor ~]# isql -v oracle_10_235 ...

2019-08-28 21:54:27 6490

原创 vmware vrealize operations manager 7部署总结

vRealize Operations Manager是vmware官方提供的针对vmware虚拟化平台的一套运维管理解决方案,通过它可以看到整个虚拟化环境的整体运行情况,潜在风险,以及优化建议等,同时可以提供一些虚拟化运行配置、容量、优化建议等等报告。本篇只是对部署过程中的一些总结,期间没有详细截图,步骤简单总结如下:1.登录vmware官网,下载vRealize-Operations...

2019-07-31 17:03:36 13052 2

原创 一次VSAN环境中更新RAID驱动的故障总结

故障现象:vSAN环境中一台HP DL380G10服务器无故关机背景:客户新上了一套HP服务器,准备跑VSAN环境,并计划把原有蓝鲸运维业务迁移到了VSAN中,在迁移过程中,突然遇到一台服务器自动关闭。查看VMWARE环境没有明显问题,初步分析服务器故障导致。解决方法:通过hp售后分析,初步诊断硬盘温度过高,导致服务器自动关机。目前更新RAID驱动后,VSAN正常运行,暂未发现机器异常。...

2019-07-22 20:48:05 1590 1

原创 一种简单的zabbix客户端 主机hostid查看方法

如果想查看zabbix一台主机的HOSTID,除了登录数据库后台查看具体的表之外,还有一种更简单的方法,那就是直接登录控制台,切换到配置选项卡,选择某台主机后,浏览器栏就会记录改主机的hostid信息,以此类似,其他ID的查看方法,同类,就不再说明了。templateid查看,如下...

2019-05-06 20:35:58 2552

原创 一次DS4700存储 坏三块盘的故障处理总结

故障原因及后果:客户运维人员巡检不到位,没有及时发现故障,部分数据丢失。故障现象如下:总结:1.存储坏盘一定要一块一块进行。 2.如上中间黄色黑三角状态的硬盘,处于硬盘部分数据已损坏,在换盘时,首先要讲驱动器置为failed模式。 3.拨盘过程中,将硬盘抽出静止1分钟左右,如果再将新盘插入存储槽中,否则有可能造成如下数据没有同步,状态如下...

2019-04-29 21:42:33 2004

原创 vsphere虚拟化平台一虚拟机丢失vmdk文件的处理过程

故障现象: 虚拟机丢失VMDK文件,无法启动。打开vsphere 控制台主机丢失,虚拟机,变成了如下样子:通过点击编辑虚拟机配置文件,发现虚拟磁盘已经丢失,如下所示:故障原因: 故障 虚拟主机资源告警,运维人员非正常关闭虚拟机,不排除人为误操作修改了虚拟机配置。故障解决方法:1. 确认该虚拟机 数据存储路径2.通过SSH 远程登录故障虚拟机所在的ESXI主机,...

2019-04-25 21:26:48 5371

原创 一个关于访问zabbix数据库 1045错误代码的处理过程

监控环境: zabbix 4.0zabbix 数据库:mariadb报错现象: 基于 zabbix监控做的监控saas,运行程序后,报错如下:register db Ping `default`, Error 1045: Access denied for user 'zabbix'@'zaxserver' (using password: YES)must have one re...

2019-04-24 14:37:42 1210

原创 zabbix 故障处理4-zabbix server 代理不正常

当我们部署完zabbix_server 端后,有时候会出现一种情况,明明仪表盘显示zabbix server 在运行,主机状态却异常显示,如下图:但是配置--主机-里面,却显示agent失败,如下图红色部分显示:此时可以看到查看一下server端的 端口以及是否安装客户端agent导致,本例zabbixserver 为linux主机,当安装完linux 客户端后,同时服务端本机...

2019-04-23 21:28:16 2168

原创 zabbix 故障处理3-模板错误

故障现象:添加zabbix 客户端主机,关联模板,提示 “不允许环形模板链接”,无法更新主机,如下图所示:其他症状: zabbix控制台主机所在群组,本例为windows 监控模板属于templates组,无法展开。故障原因: templates os windows 模板自身关联了自己,取消关联,故障解决。...

2019-03-28 18:35:29 1400

原创 COMMVAULT 软件小版本查询

有几年没摸COMMVAULT 软件备份了,重新使了一下老版本,发现很多都忘了,给客户做ORACLE异机恢复,半天才发现版本小版本号的具体位置,记录一下。貌似V11法一 法二是可以具体的小版本号的。法一:通过commvault 控制台,以下虽然列出了具体的版本及更新号,但却没有告诉我们小版本是那个。比如: V10 SP。。。。法二:进程方法,同样没有告诉我们小版本是那个法三:突然...

2019-03-20 19:28:45 684

原创 zabbix 故障处理2-配置文件

在实际部署zabbix监控过程中,有时候会出现一种现象,当监控客户端部署了zabbix agent后,并且正确进行了模板链接,但是当我们进行主机配置检查后,发现监控项不支持,此时容易忽略的一点就是客户端配置文件中的自定义脚本未正常授权,或者脚本属主权限不对,导致出现某某监控项不支持的情况,此时,可从三方面进行检查。1.zabbix_agent配置文件 尤其是自定义脚本部分是否正确。2.自定...

2019-03-17 16:34:34 609

原创 监控和智能运维的完美结合

跟着公司业务的转型,花了一些时间认真研究了一下自动化运维的相关知识,了解了蓝鲸这个自动化运维平台。通过学习看到了蓝鲸PAAS 平台的强大之处。对于运维人员而言,的确能帮助我们解决一部分重复性的工作,提高运维工作效率。放个图,近期的工作总是围绕这个图而展开,有监控和自动化运维需求的也可以和我司联系。...

2019-03-14 20:34:14 986

原创 zabbix故障处理1-网络防火墙原因

接触zabbix有段时间了,对近期测试中遇到的一些问题,做个简单总结:现象:客户端安装完zabbix agent后, zabbix控制台 agent 报错, agent is unreachable....解决方法:1.查看主机配置信息。 2. 根据报错问题,查看 没有路由。 根据提示信息,找到配置信息,检查 agent IP地址,以及进行ping测试检查...

2019-03-14 19:39:53 803

原创 昆腾虚拟带库修改IP注意点--需重启

接到客户服务请求,希望修改昆腾带库的IP地址,修改IP地址,本身很容易,图形界面直接改就可以了,如下图所示: 以上昆腾带库不同型号大同小异,如上面,选择编辑如上IP地址,然后,点击update,之后按提示进行一步一步确认就可以了。需要注意的地方,昆腾带库修改IP地址,需要注意的地方:带库修改IP地址后,会自动重启虚拟带库,如果做为备份介质的话,一定给客户提前确认好。本身重启时间会在...

2019-02-26 10:33:44 825

原创 一些曾被忽视掉的LINUX命令之 "lsblk" 命令

在有些运维场景中,如果采用了LVM逻辑卷管理的方式,如果我们想查看LV 与物理设备之间的关系,在AIX平台上我们可以通过lsvg 得到一些卷组和物理硬盘的对应关系。示例如下:# lsvg -p rootvgrootvg:PV_NAME           PV STATE          TOTAL PPs   FREE PPs    FREE DISTRIBUTIONhdis...

2019-02-20 19:52:22 2555

原创 一些曾被忽视掉的LINUX命令之 "FILE" 命令

在Linux系统中,如果我们想知道一个文件的文件类型,可以通过FILE命令来进行查询。简单举例说明如下:示例1[root@localhost ~]# file /bin/sh/bin/sh: symbolic link to `bash'总结:本例可以看出/bin/bash 是 bash文件的连接文件。示例2[root@zaxserver shell]# chmod u+x ...

2019-02-18 21:30:16 191

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除