![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
linux
砚上有墨
这个作者很懒,什么都没留下…
展开
-
ssh登录时间久或登陆后报错
这是为了与使用rsh的旧安装兼容,在rsh中,您可以说“名为darkstar的计算机上名为bob的用户可以作为alice登录,而不显示任何凭据”(通过在~alice/.rhosts中写入darkstar bob)。如果客户端计算机在Internet上,则很有可能它们没有任何反向DNS,它们的反向DNS无法解析转发,或者它们的DNS除了IP地址已经告诉您的“属于此ISP”之外,不提供任何信息。登陆的时候客户端需要对服务器端的IP地址进行反解析,如果服务器的IP地址没有配置PTR记录,那么就容易在这里卡住了。原创 2023-09-19 13:16:56 · 2037 阅读 · 0 评论 -
在linux和redhat企业版本中使用yum history回滚更新包
不推荐对系统进行小版本降级(如将 RHEL6.1 降到 RHEL6.0),因为在这种降级中,libgcc和其他库不会按预期回滚,系统将处于“broken state”。想要进行少量更新的回滚,可以用yum的history选项。回滚 selinux-policy-* 包到老版本是不支持的。在redhat和linux中使用yum回滚更新。原创 2023-08-22 17:52:11 · 861 阅读 · 0 评论 -
系统盘崩溃挂盘进入救援模式选择continue无法进入
问题:系统盘崩溃挂盘进入救援模式选择continue无法进入,始终读码或者黑屏。原因:出现这个界面一般是在选择 "1 Continue" 后,某些文件系统没有成功 mount导致解决方法:再次进入救援模式,但是输入 3,然后查看lvs等信息。原创 2023-07-04 09:18:58 · 355 阅读 · 0 评论 -
gsch和redirfs模块导致系统hang或者重启 。
Gluster配置信息被删除,但数据仍保留的话,可以通过创建新卷,正确迁移数据,可以恢复gluster卷和数据。一些命令只需要在Gluster集群中任意一个节点执行一次即可,比如“gluster volume create”,而例如“gluster peerstatus ”命令可以在每个节点独立多次执行。如果发现由Gluster引起的问题,可以提交Bug和patch,并可以社区和邮件列表中讨论,以帮助改善Gluster系统。复制卷会自动进行数据同步和修复,这个在同步访问数据时触发,也可以手动触发。原创 2023-03-31 16:54:42 · 844 阅读 · 0 评论 -
Linux系统权限集中管理项目案例实践
Linux系统权限管理是Linux运维工作的重中之重。若服务器不需要团队协作运维管理,那么超级权限可以集中在一个人手中,但是很多时候,企业服务器的数量并不止一台,需要很多运维人员共同管理,甚至还需要为开发人员分配管理服务器的用户账号,因此,如何科学地分配和管理,让每个用户既能达到工作要求,又不会越权访问(获得工作需求以外的权限)非常重要。原创 2023-03-15 20:32:17 · 1142 阅读 · 0 评论 -
sed命令的使用
在一般sed的用法中,所有来自stdin的内容一般都会被列出到屏幕上。但如果加上-n参数后,则只有经过sed特殊处理的那一行(或者动作)才会被列出来。更多sed使用方式参考:https://www.jb51.net/article/194232.htm。直接将 sed 的动作写在一个文件内,-f filename则可以执行filename内的sed命令。需求:将“This is a big test”中的“big”改为“small”直接在指令列模式上进行 sed 的动作编辑。利用sed删除某行内容。原创 2022-11-17 12:01:35 · 273 阅读 · 0 评论 -
linux开机启动过程
整个过程基本可以分为BIOS–>MBR(GRUB)–>Kernel–>Init–>Runlevel。BIOSBIOS(Basic Input/Output System),基本输入输出系统,该系统存储于主板的ROM芯片上,计算机在开机时,会最先读取该系统,然后会有一个加电自检过程,这个过程其实就是检查CPU和内存,计算机最基本的组成单元(控制器、运算器和存储器),还会检查其他硬件,若没有异常就开始加载BIOS程序到内存当中。详细的BIOS功能,这边就不说了,BIOS主要的一个功转载 2021-09-11 19:43:23 · 149 阅读 · 0 评论 -
开机提示grub
GRUB是多启动规范的实现,它允许用户可以在计算机内同时拥有多个操作系统,并在计算机启动时选择希望运行的操作系统。GRUB可用于选择操作系统分区上的不同内核,也可用于向这些内核传递启动参数。修复参考文章地址:https://www.linuxprobe.com/boot-grub.html...原创 2021-09-11 19:31:16 · 271 阅读 · 0 评论 -
Linux 查看磁盘被占满,但是实际并未全部占用
问题: 在Linux中使用df -hT命令查看硬盘占用情况 ,硬盘显示占用100%, 但是使用du -h --max-depth=1 查看/目录实际占用情况 并没有全部占用解决方案:使用命令: lsof | grep delete 查看已删除的文件是否被占用,无法正确删除,如果被占用,确定到该进程的pid ,将该进程重启即可,如无法解决查看挂载配置。重新挂载下即可...原创 2021-08-04 16:10:56 · 1788 阅读 · 0 评论 -
系统被注入病毒排查
1、#top –d 1 –c #查看异常进程#netstat -anp #关注“SYN_SENT”进程#lsof #查找异常进程#ll /proc/PID |grep exe #查看进程物理路径2、#Kill -19 PID (or kill -STOP PID)#暂停异常进程#记录PID号,后面进行删除3、删除对应的木马文件先tar命令打包备份#rm -fr /tmp/ssss特殊文件删除#chattr -aji file(可能还要操作目录#chattr -aji /tmp/)#原创 2021-08-17 09:39:11 · 560 阅读 · 0 评论 -
系统出现 The disk dr iue for/uar/wwu/dreamis not ready yet or notpresent
开机按s看是否恢复,一般是磁盘分区问题,检查fstab挂载文件DiskPart 问题,参考:https://www.eassos.com/how-to/fix-diskpart-has-encountered-an-error.php原创 2021-07-29 20:54:16 · 146 阅读 · 0 评论 -
LVS-系统配置的参数net.ipv4.tcp_keepalive_time不生效
使用LVS做负载配置参数net.ipv4.tcp_keepalive_time不生效问题:为了节省TCP连接时间,我们选择建立几个固定的TCP长连接,然后把所有的消息平均分配的这几个TCP通道上传送给对方。另一种情况:客户端和服务端之间是一个会话,要隔一段时间发个心跳。现在出现了第三种情况,我是一个代理程序,要转发一个会话,让服务端和客户端都无感知;而且多个会话可以复用一个通路(1)我需要在会话建立之前就建立连接;(2)没设计代理的心跳接口,我不能自己给后端发心跳;但代理和后端之间隔着LVS。转载 2021-07-29 20:45:18 · 2713 阅读 · 1 评论 -
服务器网络问题排查参考笔记
网络问题出现还是要tcpdump及时抓包环境:云上环境能够ping通服务器的同时端口不通的排查方法参考:https://help.aliyun.com/document_detail/40572.htm?spm=a2c4g.11186623.2.22.78c34a2bCFqc10在Windows实例中访问外部网络不通的处理方法:https://help.aliyun.com/knowledge_detail/40703.html?spm=5176.10695662.1996646101.search原创 2021-06-30 21:05:13 · 140 阅读 · 0 评论 -
linux系统出现bash:fork:retry resource temporarily unavailable的报错
问题场景:linux系统出现bash: fork: retry resource temporarily unavailable 的报错问题原因用户能够使用的进程数太少和文件描述符太小导致的,每一个文件描述符会和一个文件对应,但是很多文件描述符也会和一个文件对应。相同的文件可以被不同的进程打开,也可以被同一个进程打开多次。解决方案一,系统层面的文件描述符涉及到系统层面的,基本上都是通过修改内核参数来实现的,修改系统中的文件描述符可以通过下面两种方式来实现:1,/proc/sys/fs/file-原创 2021-05-30 21:48:20 · 3637 阅读 · 0 评论 -
在 /var/log/message 中么有发现日志
问题:在 /var/log/message 中么有发现日志,或者发现 imjournal: begin to drop messages due to rate-limiting.主要原因是:The limits are controlled in the /etc/systemd/journald.conf file.RateLimitInterval=30sRateLimitBurst=1000处理:在/etc/rsyslog.conf 需要设置:$ModLoad imjournal$imj原创 2021-05-25 13:41:48 · 437 阅读 · 0 评论 -
无法通过SSH远程登录Linux实例时的排查指引
阿里云有现成文档可参考:链接:https://help.aliyun.com/document_detail/41470.htm?spm=a2c4g.11186623.2.33.74ea3e86oT9u4F原创 2021-05-20 23:32:23 · 187 阅读 · 0 评论 -
iptables开启和关闭
查看iptables规则的话,就用iptables -L清除iptables规则的话,用iptables -F ,that‘s aaaaalllllll~~关闭,可以有两种命令,一种是敲击 /etc/init.d/iptables stop 另一种是 services iptables stopchkconfig状态chkconfig iptables off(设置自动启动为关闭)chkconfig iptables on(设置自动启动为启动)chkconfig --del iptables原创 2021-05-20 23:29:22 · 12265 阅读 · 0 评论 -
SSH登录服务器提示“Host key verification failed”错误
问题描述使用SSH登录Linux实例时,提示“Host key verification failed”错误信息,导致无法正常连接Linux实例。@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED! @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@IT IS PO原创 2021-04-27 23:38:35 · 1442 阅读 · 1 评论 -
默认Shell被修改造成Linux服务器SSH远程登录报错
问题描述当使用SSH命令登录Linux系统的ECS实例时,即便使用了正常的账号和密码也会连接失败,在命令行或secure日志中也会出现类似如下的错误信息。This account is currently not available.Connection to 127.0.0.1 closed.Received disconnect from 127.0.0.1: 11: disconnected by user.pam_unix(sshd:session): session closed for原创 2021-04-27 15:32:24 · 1109 阅读 · 0 评论 -
启动SSH服务时出现“Bad configuration options”报错
在Linux系统的ECS实例启动SSH服务,命令行或secure日志中可能会出现类似如下信息。/etc/ssh/sshd_config: line 2: Bad configuration options:\ /etc/ssh/sshd_config: terminating, 1 bad configuration options问题原因配置文件存在文件编码、配置错误等异常,导致服务启动失败。解决方案解决该问题,请参阅如下步骤进行排查和修复。根据报错信息修改配置文件上传文件重新安装SSH原创 2021-04-27 14:59:51 · 25110 阅读 · 1 评论 -
无法远程连接Linux服务器
问题描述通过SSH远程登录Linux系统的ECS实例时,连接失败,无法正常登录Linux实例。问题原因下图为SSH远程登录的关联因素示意图,由此可见,SSH远程登录失败的可能原因较多。解决方案SSH登录失败时存在明确的报错信息处理流程图详细信息SSH远程登录失败时,系统通常会返回报错信息。您可以根据报错信息,从以下常见的报错信息中匹配符合您现场实际情况的报错,快速定位问题原因及解决方案。说明:如果您的报错信息不在以下列表中,您可以通过搜索引擎查询报错信息,或者您也可以参见本文中的排查方原创 2021-04-27 14:22:36 · 1450 阅读 · 0 评论 -
分析系统性能与代码优化
性能优化的核心是找出系统的瓶颈点,问题找到了,优化的工作也就完成了大半; 这里介绍的性能优化主要从两个层面来介绍:系统层面和程序层面。分析系统瓶颈系统响应变慢,首先得定位大致的问题出在哪里,是IO瓶颈、CPU瓶颈、内存瓶颈还是程序导致的系统问题;一般使用top工具能够比较全面的查看我们关注的点:$top top - 09:14:56 up 264 days, 20:56, 1 user, load average: 0.02, 0.04, 0.00 Tasks: 87 tota原创 2021-03-18 15:01:54 · 230 阅读 · 0 评论 -
net.nf_conntrack_max 设置异常问题
故障原因内核参数 net.nf_conntrack_max 系统默认值为”65536”,当nf_conntrack模块被装置且服务器上连接超过这个设定的值时,系统会主动丢掉新连接包,直到连接小于此设置值才会恢复。同时内核参数“net.netfilter.nf_conntrack_tcp_timeout_established”系统默认值为”432000”,代表nf_conntrack的TCP连接记录时间默认是5天,致使nf_conntrack的值减不下来,丢包持续时间长。nf_conntrack模块在首原创 2021-01-17 17:03:34 · 8438 阅读 · 0 评论 -
nf_conntrack
nf_conntrack(在老版本的 Linux 内核中叫 ip_conntrack)是一个内核模块,用于跟踪一个连接的状态的。连接状态跟踪可以供其他模块使用,最常见的两个使用场景是 iptables 的 nat 的 state 模块。 iptables 的 nat 通过规则来修改目的/源地址,但光修改地址不行,我们还需要能让回来的包能路由到最初的来源主机。这就需要借助 nf_conntrack 来找到原来那个连接的记录才行。而 state 模块则是直接使用 nf_conntrack 里记录的连接的状态来匹原创 2021-01-17 16:55:31 · 6857 阅读 · 0 评论 -
Linux系统故障诊断 - 启动文件丢失之后如何找回
问题描述:客户反馈系统无法远程登录,实际系统启动本身就有问题。1.首先挂盘后 chroot 报的 ihave no name 这本身就是个坑,说明系统内缺少了文件导致异常。2.使用strace跟踪一下chroot的过程,看下丢失的文件strace -F -ff -t -tt -s 256 -o ch.out chroot /mntgrep -i "no such" ch.out.pid |grep "so"3. 查看对应文件的关系(如图)4. 确认系统上丢失了最终的 libnss_fi原创 2020-07-24 16:12:02 · 362 阅读 · 0 评论 -
grub.conf文件被清空
目前普遍部署的的grub是,依据官方的叫法,grub legacy和grub。社区常见的称呼是grub(或者grub1)和grub2。我们引用的文档可能遵循社区的用法;这里我们遵循官方的用法。比如,我们说CentOS 6上默认部署的是grub legacy,而CentOS 7上默认部署的是grub;而不说我们说CentOS 6上默认部署的是grub1,而CentOS 7上默认部署的是grub2。除了要注意不同版本的grub,排查、诊断或者确认时,有可能需要使用文件系统的元数据或者数据。因此,需要了解如何检原创 2020-07-21 16:09:38 · 498 阅读 · 0 评论 -
Linux系统常见问题诊断及修复脚本
Linux系统常见问题诊断覆盖以下场景:Linux系统常见启动问题修复覆盖以下问题:OS参数收集脚本:#!/bin/bash# create log file foldertest -e /var/log/ecsanalyse || mkdir /var/log/ecsanalyse;datetime=$(date +%Y%m%d-%H-%M-%S-%N)log_filename=ecs_analyse_${datetime}.loglog_file=/var/log/ecsanalys原创 2020-07-21 15:53:38 · 426 阅读 · 0 评论 -
root登录异常
/etc/passwd /etc/shadow ( 用户名 root polikt dbus 等关键用户存在与否,文件为空,格式乱(dos2unix)/etc/pam.d 目录下是否有为空的文件及参数设置是否正常,如常见的 sys- tem-auth passwd。/etc/pam.d 下面所有文件里面涉及的 so 文件,看看文件是否存在,是否为空 / usr/lib64/security。查 /etc /lib64 /bin /sbin /usr/bin /usr/sbin 等目录有..原创 2020-07-21 09:38:58 · 470 阅读 · 1 评论 -
Linux系统启动异常排查
部分 CentOS 系统启动黑屏,无异常报错的场景,可以 fsck 一下系统盘。根分区空间满,以及 inode 数量耗尽。升级内核或者从老的共享实例迁移到独享规格导致的启动异常。3.1 手动注入驱动 (mkinitrd virtio 相关驱动 )。3.2 修改 grub 的启动顺序,优先尝试使用老内核启动。3.3 /boot 目录下面内核的关联文件是否全(下面仅为 demo,不同系统内核版本文件不一致,部分内核版本 boot 下的 i386 目录也是有用的)。config-4.9.0-7.原创 2020-07-20 16:20:11 · 547 阅读 · 0 评论 -
linux常见命令以及第三方文档库
linux常见命令以及第三方文档库查看系统硬件信息查看CPU信息#cat /proc/cpuinfo或[root@centos8 ~]# lscpuArchitecture: x86_64CPU op-mode(s): 32-bit, 64-bitByte Order: Little EndianCPU(s): 8On-line CPU(s) list: 0-7Thread(s) per core:原创 2021-03-17 21:49:04 · 250 阅读 · 0 评论 -
ldd 查看程序依赖库
作用:用来查看程式运行所需的共享库,常用来解决程式因缺少某个库文件而不能运行的一些问题。示例:查看test程序运行所依赖的库:/opt/app/todeav1/test$ldd testlibstdc++.so.6 => /usr/lib64/libstdc++.so.6 (0x00000039a7e00000)libm.so.6 => /lib64/libm.so.6 (0x0000003996400000)libgcc_s.so.1 => /lib64/libgcc_s.so原创 2021-03-18 14:49:16 · 152 阅读 · 0 评论