![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
故障记录
大眼、不聚光
这个作者很懒,什么都没留下…
展开
-
故障记录---docker僵死
docker启动的时候,会在运行目录(/var/run/docker/runtime-runc/moby)(不同环境,可能目录不一样,可以通过find / -name ‘容器ID’ 查找)下生成以docker-ID,因为docker异常停止,改容器文件并没有删除,所以启动的时候,会报错该容器已存在。查看docker进程状态,显示句柄数过多,于是重启了docker。docker进程僵死,docker命令无法使用。手动kill掉进程后,再次启动,成功。原创 2024-06-19 14:21:08 · 345 阅读 · 0 评论 -
故障记录---坏盘导致ssh起不来
问题背景及现象:宿主机硬盘损坏后,虚拟机部分进程起不来,ssh连不上。处理过程:登录某个虚拟机发现,文件系统只读,touch文件都创建不了, 执行mount命令出现如下信息: 查看只读的文件盘符cat /proc/mounts |grep --col ro如果你看到的只读文件盘符是非/分区的盘符,可以直接卸载umount /dev/sdb1# 如果发现有提示“device is busy”,找到是什么进程使得他busy fuser -m /dev/sdb1 //显示使用这个模原创 2023-11-20 15:22:23 · 95 阅读 · 1 评论 -
故障记录---attr权限问题导致messages日志无法删除
attr权限是root用户为了限制自己权利而设置的特殊权限,但是自己是可以修改的;磁盘爆满,查看后发现messages日志占用33G,需要清除messages日志。chattr +a表示不能删除,不能覆盖,可以追加。chattr +i表示不能删除,不能覆盖,不能追加。发现有a权限,a权限的意思是只允许追加不允许删除。去掉a权限后,再执行就可以了。查看权限,发现权限是600。原创 2023-11-20 15:13:51 · 133 阅读 · 1 评论 -
故障记录---程序select早半秒,oracle崩了
数据写入未完成又开始进行查询,同时进行此操作的查询数量较多导致进程僵死,内存溢出,随后kswap0开始工作,导致cpu升高,最后oracle主机彻底卡死。业务查询速度慢,程序后台报错连接数据库超时,终端连接主机速度很慢,且报错:‘abrt-cli status‘ timed out。找到写入数据的时间和查询时间比对,发现插入时间比查询时间晚了半秒,导致数据查询为空。先kill僵尸进程和父进程,进程恢复了,但是内存并没有释放。取程序日志找到最早报错时间的日志,发现查询返回结果为空,原创 2024-02-01 17:13:46 · 150 阅读 · 0 评论 -
故障记录---udev规则问题导致数据库实例起不来
使用udev来创建自动的asm磁盘组是一种常见的方式。udev是用户空间的设备管理工具,可以根据系统中硬件的信息动态地创建和管理设备文件。asmcmd是Oracle ASM的命令行工具,用于管理Oracle自动存储管理。如果使用udev创建了asm磁盘组但asmcmd不显示磁盘组信息,可能是因为:1、udev规则没有正确创建或没有被正确应用。2、ASM实例没有正确启动或者配置不正确。3、asmcmd没有正确连接到ASM实例。原创 2024-04-11 11:27:02 · 352 阅读 · 1 评论