一、Linux故障排查思路
1、重视报错提示信息
每个错误的出现,都是给出错误提示信息,一般情况下这个提示基本定位了问题的所在。因此一定要重视这个报错信息,如果对这些错误信息视而不见,问题永远得不到解决。
2、永远不要忘记日志文件
日志是排查问题的第一思路,一定要学会查看日志的习惯。
系统日志:dmesg、 /var/log/messages、 /var/log/secure
应用日志:
Apache:$APACHE_BASE/logs/error_log $APACHE_BASE/logs/access_log
Nginx:$NGINX_BASE/logs/error_log $NGINX_BASE/logs/access_log
Tomcat:$TOMCAT_BASE/logs/catalina.out
3、分析、定位问题、解决问题
综合分析过程,要以日志为导向,配合实际的应用环境,根据报错信息,排出故障。
4、网络故障排查思路
1)网络硬件传输问题
2)检查网卡是否能正常工作,可以从网卡是否正常加载、网卡IP设置是否正确
3)检查DNS是否设定正确
4)服务是否正常打开
5)访问权限是否打开(iptables、selinux)
6)局域网主机之间联机是否正常
二、影响Linux性能的各种因素
1、系统硬件资源
1)CPU
如何判断多核CPU和超线程
消耗CPU的业务:动态web服务、mail服务
2)内存
》物理内存与swap的取舍
》选择64位Linux操作系统
消耗内存的业务:内存业务数据库(redis、hbase、mongodb)
3)磁盘IO
》 RAID技术(raid1、raid5、raid10)
》SSD磁盘
消耗磁盘的业务:数据库服务器
4)网络带宽
》网卡、交换机的选择
》操作系统双网卡绑定
消耗带宽的业务:hadoop平台、视频业务平台
2、操作系统相关资源
1)系统安装优化
磁盘分区、raid设置、swap设置
2)内核