Linux常见运维故障及处理方法分享(不定期持续更新)

1、Redhat7重启后出现网卡名有变动,或者要固定使用eth的方式命名网卡。
(1)在/etc/sysconfig/grub.conf配置文件中追加参数net.ifnames=0
(2)执行命令grub2-mkconfig -o /etc/grub2.cfg,生层配置文件
(3) reboot重启。


2、cpu占用过高。
(1) 用ps aux查看哪个进程占用cpu过高。
(2) top -H -p pid 查看哪个线程占用cpu
(3)jstack pid
(4)对每个高耗CPU的线程,把线程id,转换为16进程数( 可以使用命令:printf "%x\n" tid ),然后从thread stack中搜索到对应的线程。
(5)按内存从大到小排列
ps -e -o "%C : %p : %z : %a"|sort -k5 -nr
(6)按cpu利用率从大到小排列
ps -e -o "%C : %p : %z : %a"|sort -nr


3、进程无法停止。
(1)用ps -aux 查看进程状态。
如果进程状态为D状态,D状态为不可中断的深度睡眠,同步IO在做读或写操作,cpu不能做其他事情,只能等待。


4、服务器更换网卡后,让ip从新生效。
(1)备份/etc/udev/rules.d/70-persistent-net.rules配置文件后将其删除。
(2)reboot重启系统后恢复。


5、Read-onlyfilesystem
A:可以重启恢复。
B:重新挂载。
(1)rm -rf /etc/.pwd.lock。
(2)mount -o remount rw / 重新以可读可写的方式挂在/文件系统。
(3)如有报错为:/dev/sda1 这样的分区信息error,那就执行fsck -y /dev/sda1修复。


6、Linux系统安装初始状态时,找不到硬盘,并无法进入下一步安装。
(1)进入COMS设置,找到硬盘设置的相关选项,并设置为兼容模式。


7、配置好iptables过滤规则后,重启iptables服务后,发现原有的规则全部丢失。
(1)修改/etc/sysconfig/iptables-config配置文件,将IPTABLES_SAVE_ON_RESTART=”no”改为yes。
(2)用iptables-save > /etc/sysconfig/iptables命令保存。


8、Vmware虚拟机中安装redhat报错,找不到硬盘。
(1)假如之前安装了redhat5版本,现在要从新安装redhat6,需要从新配置创建VMware。


9、redhat某一时间cpu利用率过高。
(1)将/var/log/sa/sa开头的文件拷贝出来。
(2)用sar命令查看cpu等资源调用情况。


10、xfs文件系统报错。
(1)执行xfs_repair -L /dev/sda1命令修复


11、创建,扩展LVM。
(1)添加物理卷:pvcreate /dev/sdc1
(2)创建卷组:vgcreate VG1 /dev/sdc1 /dev/sdc2
(3)创建逻辑卷1:lvcreate -n lv1 -L +50M VG1
(4)创建逻辑卷2:lvcreate -n lv2 -L +60M VG1
(5)删除/dev/VG1/lv1:lvremove /dev/VG1/lv1
(6)删除/dev/VG1:vgremove /dev/VG1
(7)删除物理卷:pvremove /dev/sdc1
(8)扩展lv:lvextend -L +50M /dev/VG1/lv2


12、清除僵死进程
ps -eal | awk '{ if ($2 == "Z") {print $4}}' | kill -9


13、报toomanyopenfile错误。
(1)先执行
echo“”>>/etc/security/limits.conf
echo“softnproc65535″>>/etc/security/limits.conf
echo“
hardnproc65535″>>/etc/security/limits.conf
echo“softnofile65535″>>/etc/security/limits.conf
echo“
hardnofile65535″>>/etc/security/limits.conf
echo“”>>/root/.bash_profile
echo“ulimit-n65535″>>/root/.bash_profile
echo“ulimit-u65535″>>/root/.bash_profile
(2)重启或者执行执行ulimit-u655345&&ulimit-n65535


14、mount命令挂载NFS服务的共享目录,没有响应。
(1)portmap服务没有启动,必须启动该服务


15、查询一个进程已经运行了多长时间。
(1)ps -eo comm,etime | grep syslogd | awk '{print $2}'


16、查看物理内存大小。
(1)dmidecode | grep Size | grep MB | awk '{a+=$2}END{print a}'


——————————————————
以上内容更新于2018-4-12,以后会持续更新。
如有错误的地方还请各位前辈私信指教~


17、问题:
xstart 图形化远程报错(/etc/ssh/sshd_config 中已经开启了X11Forwarding yes,但还是有报错)
Linux常见运维故障及处理方法分享(不定期持续更新)
解决方法:
安装”xorg-x11-xauth“软件包,在系统光盘里就有。


18、查看系统最后重启时间:
(1):
last reboot

(2):
uptime

(3):
who -b


19、sar性能数据分析。
若查看/root/sa29文件 从8:10-9:00的cpu占用情况
命令:sar -u -s 08:10:00 -e 09:00:00 -f /root/sa29


20、
Linux常见运维故障及处理方法分享(不定期持续更新)

解决方法:
echo -1 >/proc/sys/kernel/perf_event_paranoid


21、rhedhat6关闭transparent hugepage的方法
在Linux6版本关闭THP的方法如下:
一、永久关闭的方法:
(1). 在/boot/grub/grub.conf文件的kernel 所在行追加如下关键字:
transparent_hugepage=never
(2). 重启操作系统后生效。
二、临时关闭的方法(下次重启时不生效):
以root身份运行如下命令:
echo never > /sys/kernel/mm/redhat_transparent_hugepage/enabled
echo never > /sys/kernel/mm/redhat_transparent_hugepage/defrag
按照以上操作后,可以通过如下命令检查是否生效:
grep -i HugePages_Total /proc/meminfo
HugePages_Total: 0
如果显示为0,代表已经关闭成功。

——————————————————
以上内容更新于2018-6-1,以后会持续更新。
如有错误的地方还请各位前辈多指教~


22、Centos7.3中禁用nouveau 显卡驱动、安装Nvidia驱动方法。
验证是否有插入显卡: lspci | grep -i nvidia

vi /etc/default/grub————(修改grub.cnf)

rd.driver.blacklist=nouveau nouveau.modeset=0————(添加此内容至参数rhgb quiet后;如下图:)
Linux常见运维故障及处理方法分享(不定期持续更新)

cp /boot/efi/EFI/centos/grub.cfg /boot/efi/EFI/centos/grub.cfg_bak————(备份grub.cfg文件)

grub2-mkconfig -o /boot/efi/EFI/centos/grub.cfg————(重新生成grub.cfg文件)

然后安装Nviaid驱动后重启即可。

nviaid -smi————验证驱动已正常安装


23、Docker常用命令手册。

查看容器:docker ps -a

启动容器:docker start CONTAINER ID

创建并后台启动:docker run --name CONTAINER_NAME -d CONTAINER ID

关闭容器: docker stop CONTAINER ID

强行终止:docker kill CONTAINER_ID

进入容器运行命令:docker exec -it CONTAINER_ID /bin/bash

不进入容器运行命令:docker exec CONTAINER_ID ls -a

删除容器:docker rm -f CONTAINER_ID

删除所有已停止的容器:docker container prune

查看容器性能信息I/O、CPU、Mem:docker stats

——————————————————
以上内容更新于2019-3-18,以后会不定期持续更新。(不关注、不点赞只收藏的行为都是耍流氓QAQ~)
如有错误的地方还请各位前辈多指教~

转载于:https://blog.51cto.com/12256367/2097211

  • 3
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值