运维故障集锦
收集平时遇到的运维故障
唐僧骑白马
时光如水,流年如梦,要么读书,要么旅行
展开
-
yum: Multilib version problems found
根据上面的报错提示,yum安装时使用。原创 2023-03-27 08:47:48 · 766 阅读 · 0 评论 -
keepalived报错:WARNING - default user ‘keepalived_script‘ for script execution does not exist - please
script_user root enable_script_security原创 2023-03-27 08:45:22 · 1872 阅读 · 2 评论 -
WARNING - script ‘/etc/keepalived/nginx_check.sh‘ is not executable for uid:gid 0:0 - disabling.
配置nginx高可用时,测试master上的nginx挂掉VIP没有漂移,查看日志时发现有nginx检测脚本的报错。解决办法:修改检测脚本的权限。再次测试后VIP能正常漂移。原创 2023-03-27 08:47:27 · 483 阅读 · 0 评论 -
invalid metric type “dictionary_file_words_count untyped“
invalid metric type "dictionary_file_words_count untyped"原创 2023-03-17 22:26:30 · 160 阅读 · 0 评论 -
你的设备遇到问题,需要重启;我们只收集某些错误信息,然后为你重新启动。
你的设备遇到问题,需要重启;我们只收集某些错误信息,然后为你重新启动原创 2023-03-10 00:19:09 · 9265 阅读 · 0 评论 -
pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host=‘files.pythonhosted.org‘,
pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host='files.pythonhosted.org', port=443): Read timed out.原创 2023-02-27 19:34:52 · 2042 阅读 · 0 评论 -
ERROR: Exception when publishing, exception message [Exec exit status not zero. Status [127]]
ERROR: Exception when publishing, exception message [Exec exit status not zero. Status [127]]Build step 'Send files or execute commands over SSH' changed build result to UNSTABLEFinished: UNSTABLE原创 2023-02-27 17:21:49 · 543 阅读 · 0 评论 -
failed: remove /prometheus/wal/000001: permission denied
提示storage权限有问题,解决办法,在报错容器下添加如下内容。k8s部署prometheus报错,查看容器日志。原创 2023-02-15 17:27:25 · 118 阅读 · 0 评论 -
Fatal error loading the DB: Permission denied. Exiting.
这个问题一般是rdb文件无法兼容导致,所有找到删除就行了。查看harbor日志,看到redis相关报错。harbor登录报错,提示核心服务不可用.原创 2023-02-15 12:30:14 · 1189 阅读 · 1 评论 -
Your account is pending approval from your GitLab administrator and hence blocked.
【代码】Your account is pending approval from your GitLab administrator and hence blocked.原创 2023-02-14 20:22:22 · 4449 阅读 · 2 评论 -
you might want to save “/run/initramfs/rdsosreport.txt“ to a USB stick or /boot
我遇到的场景是Centos7强制下电,开机后报错,报错的大致意思是系统文件出现错误。1、创建快照,以免修复失败,还原重新修复。2、使用xfs_repair命令进行修复。修复后输入reboot重启即可。使用如下命令进行修复。原创 2023-02-11 15:41:58 · 2165 阅读 · 0 评论 -
使用fio压测磁盘性能导致文件系统损坏
FIO测试工具支持裸盘分区、文件系统两种方式测试I/O性能。如果直接测试裸盘分区,会破坏裸盘分区中的文件系统元数据,导致无法访问该裸盘分区中的文件,甚至导致实例宕机。使用FIO的文件系统测试性能方式时,不存在上述问题。使用fio测试裸盘后使用resize2fs刷新文件系统提示文件系统损坏。文件系统被破坏后只能重新格盘,无法恢复数据。原创 2022-12-15 15:24:23 · 2217 阅读 · 0 评论 -
curl#60 - “Peer‘s Certificate has expired.
【代码】curl#60 - "Peer's Certificate has expired.原创 2022-12-13 14:16:41 · 1671 阅读 · 0 评论 -
entos7主网卡ip不通
背景:机器突然不能正常ssh连接,查看ssh状态,网络启动均正常,selinux已关闭,防护墙未开启原因:network与NetworkManage起冲突,CentOS7.x系统,有NetworkManager和network两种网络管理工具。关闭NetworkManager后ssh连接正常centos7最好把NetworkManager 网络管理给关闭原创 2022-12-06 14:07:10 · 278 阅读 · 0 评论