- 博客(143)
- 资源 (4)
- 收藏
- 关注
原创 系统异常重启后nfs无法启动提示客户证书太弱
查看/etc/hosts.deny 中是否添加了拒绝策略,若添加策略将其注释,all:all策略也要注释。或者在/etc/hosts.allow中添加允许规则。如: all:127.0.0.1。然后重启nfs或者kill -9杀死所有占用nfs的进程然后重启nfs.问题:系统异常重启nfs组件启动报错,rpcbind启动正常。查看firewalld、selinux是否开启,开启则关闭。利用rpcinfo命令发现没有rpc网络监听。
2024-11-25 21:50:35
234
原创 FusionCube 重置admin密码
5.执行update命令,将密码重置为初始密码。7. 恢复后使用默认密码登录FCC portal(默认密码:IaaS@PORTAL-CLOUD8!1.使用FCC浮动IP登录FCC主节点,并执行以下命令切换到root用户。3.1.1及之后的版默认密码为IaaS@P ORTAL-CLOUD8!FusionCube Center版本查询方法:登陆FCC,执行。3.0.1及之前的版本默认密码为Huawei@CLOUD8!输入数据库密码(默认密码IaaS@OS-CLOUD8!4.找到第一条历史密码的密文。
2023-10-24 15:27:15
1156
原创 ssh登录时间久或登陆后报错
这是为了与使用rsh的旧安装兼容,在rsh中,您可以说“名为darkstar的计算机上名为bob的用户可以作为alice登录,而不显示任何凭据”(通过在~alice/.rhosts中写入darkstar bob)。如果客户端计算机在Internet上,则很有可能它们没有任何反向DNS,它们的反向DNS无法解析转发,或者它们的DNS除了IP地址已经告诉您的“属于此ISP”之外,不提供任何信息。登陆的时候客户端需要对服务器端的IP地址进行反解析,如果服务器的IP地址没有配置PTR记录,那么就容易在这里卡住了。
2023-09-19 13:16:56
2186
原创 在linux和redhat企业版本中使用yum history回滚更新包
不推荐对系统进行小版本降级(如将 RHEL6.1 降到 RHEL6.0),因为在这种降级中,libgcc和其他库不会按预期回滚,系统将处于“broken state”。想要进行少量更新的回滚,可以用yum的history选项。回滚 selinux-policy-* 包到老版本是不支持的。在redhat和linux中使用yum回滚更新。
2023-08-22 17:52:11
992
原创 系统盘崩溃挂盘进入救援模式选择continue无法进入
问题:系统盘崩溃挂盘进入救援模式选择continue无法进入,始终读码或者黑屏。原因:出现这个界面一般是在选择 "1 Continue" 后,某些文件系统没有成功 mount导致解决方法:再次进入救援模式,但是输入 3,然后查看lvs等信息。
2023-07-04 09:18:58
621
原创 如何配置Linux操作系统内DNS配置不被DHCP自动更新
通常情况下,租户创建网络时会定义该网络使用的DNS服务器,业务虚拟机会通过DHCP获取到该信息,并配置于虚拟机内部。但是有部分情况下,客户业务仅需要使用网络提供的DHCP IP分配能力,不需要平台提供的DNS信息,这时就需要确保虚拟机内自定义DNS并确保不被NetworkManager或其他DHCP客户端软件自动还原。DNS服务器配制是立即生效的,网卡配制是永久的,每次重启DNS服务器配制的DNS会被网卡配置文件中的DNS覆盖。1网卡设置配置文件里面DNS服务器地址设置,2.系统默认DNS服务器地址设置。
2023-04-28 14:40:21
1398
2
原创 当 rsync/scp 不可用时,从系统传输文件或者 sosreport。
如果您在您的环境中使用 iptables,则为 RHEL 6 指定的现有指令也适用于 RHEL 7。与 dport 关联的端口可以是任意的,但建议使用未使用的大号端口以避免任何冲突的网络流量。与 dport 关联的端口可以是任意的,但建议使用未使用的大号端口以避免任何冲突的网络流量。与“端口”关联的端口可以是任意的,但建议使用未使用的大号端口以避免任何冲突的网络流量。如果您的环境中没有使用 iptables,您可以跳到“配置 nc”如果您的环境中没有使用 iptables,您可以跳到“配置 nc”
2023-04-25 12:12:57
594
翻译 在Linux系统救援环境中实现联网
5) 如果您需要将 sosreport 传输到不同子网上的主机或直接传输到红帽,请添加默认路由。需要根据向每个接口公开的 IP 地址范围确定应使用哪个接口。6) 使用 验证是否分配了正确的路由。您可以按以下形式向设备添加默认路由。3)以以下形式向设备添加IP地址。将显示连接到系统的可用设备。例如,如果要添加默认路由。4) 验证是否通过使用。使用 IP 命令套件。
2023-04-25 09:45:15
758
翻译 在救援模式下收集 sosreport
Red Hat 技术人员可以通过收集的信息对您遇到的技术问题进行更全面的分析。当救援模式尝试把挂载点绑到 /mnt/sysimage 时,有时会失败。命令的时候,系统会提示您输入名字及问题单号。注意,您无法在 RHEL5 及以后版本使用该命令。如果您选择了 ”skip”,在执行下一步之前,您必须手动的挂载您的文件系统。等到网卡被找到后,启用网卡,这样需要的数据就可以被传输到另外一台主机上。通过对应版本的安装光盘引导启动,并根据以下步骤,实现从救援模式收集。当救援模式启动完成,选择您要使用的语言。
2023-04-25 09:38:49
523
原创 RedHat Linux系统故障修复—— grub引导、MBR损坏修复过程
1.首先,MBR是安装在硬盘的第一个扇区上占用了512个字节,其中前446字节是bootloader用于引导操作系统(中间的64个自己用来指定分区,每个分区为16个字节,所以一个操作系统最多有四个主分区,最后两个字节是标志位,用于表示OK或者not ok),它不在分区上,而是位于分区之外,因为分区是对于操作系统而言的,而MBR是用于引导操作系统的,因此现在模拟MBR损坏只要把磁盘上第一个扇区的钱446个字节破坏掉即可。下一步,要把文件从这个RPM里面分离出来,并还原到/etc目录下.此时,内核已修复完成!
2023-04-25 09:11:02
3731
原创 gsch和redirfs模块导致系统hang或者重启 。
Gluster配置信息被删除,但数据仍保留的话,可以通过创建新卷,正确迁移数据,可以恢复gluster卷和数据。一些命令只需要在Gluster集群中任意一个节点执行一次即可,比如“gluster volume create”,而例如“gluster peerstatus ”命令可以在每个节点独立多次执行。如果发现由Gluster引起的问题,可以提交Bug和patch,并可以社区和邮件列表中讨论,以帮助改善Gluster系统。复制卷会自动进行数据同步和修复,这个在同步访问数据时触发,也可以手动触发。
2023-03-31 16:54:42
1173
原创 Linux系统权限集中管理项目案例实践
Linux系统权限管理是Linux运维工作的重中之重。若服务器不需要团队协作运维管理,那么超级权限可以集中在一个人手中,但是很多时候,企业服务器的数量并不止一台,需要很多运维人员共同管理,甚至还需要为开发人员分配管理服务器的用户账号,因此,如何科学地分配和管理,让每个用户既能达到工作要求,又不会越权访问(获得工作需求以外的权限)非常重要。
2023-03-15 20:32:17
1456
原创 故障记录-磁盘性能下降导致节点触发迁移
默认情况下, Linux会最多使用40%的可用内存作为文件系统缓存。当超过这个阈值后,文件系统会把将缓存中的内存全部写入磁盘, 导致后续的IO请求都是同步的。将缓存写入磁盘时,有一个默认120秒的超时时间。出现上面的问题的原因是IO子系统的处理速度不够快,不能在120秒将缓存中的数据全部写入磁盘。IO系统响应缓慢,导致越来越多的请求堆积,最终系统内存全部被占用,导致系统失去响应。这里网络已经不通,丢包无法访问导致后续请求堆积。存储磁盘出现问题,磁盘io下降。drbd脑裂,访问对端不通。
2023-03-14 08:39:32
341
原创 linux下查看wwn号
linux终端命令行中通过“cat /sys/class/fc_host/host*/port_name”命令查看wwn号即可cat /sys/class/fc_host/host*/port_name
2023-01-06 22:04:26
1042
原创 SRE-Google运维解密随记-4
我们发现,最安全的方式是在服务收到新数据之后,仍然维持之前的。的容量百分比,以及每个阶段之间等待的时间应该由服务的规模、发布的规模,以及服。在处理数据之前,应该检查数据的语法,甚至在可能的情况下,检查数据语义的正。非紧急的发布过程应该是按阶段进行的。HTTP流量与带宽预估,发布时的峰值,流量的组成,6个月的预测。配置运行,直到某个人来批准采用新数据这些数据可能是无效的。接收到不合理的配置文件或者输入数据时,应该继续保持之前的。安全设计评审,安全代码评审,垃圾邮件风险,验证,SSL。
2023-01-04 18:44:27
491
1
原创 SRE-Google运维解密随记-3-分布式系统的监控
收集、处理、汇总,并且显示关于某个系统的实时量化数据,例如请求的数量和类型,另外一方面,针对那些还没有发生,但是即将发生的问题,黑盒监控通常是没。优化系统的时间,所以经常会牺牲一些短期内的可用性和性能问题,以换取未来系统性。这里的两个术语是可以互换的:指在物理机、虚拟机,或者容器内运行的某个实例。与白盒监控最简单的区别是:黑盒监控是面向现象的,代表了目前正在发生的而非。来说,他们看到的是网站缓慢,数据库读操作的缓慢则是原因。●该规则是否能够检测到一个目前检测不到的、紧急的、有操作性的,并且即将发。
2023-01-03 21:36:24
460
原创 SRE-Google运维解密随记-2-服务目标质量
这三项分别是指该服务最重要的一些基础指标、这些指标的预期值,以及当指标不符合预期时的应对计划。SLI:很明显,提供一个客观的方式来度量SLO是很重要的,否则大家就会产生分歧。数据经常是最直接的用户指标,但是由于条件限制可能只能监控服务器端的延迟数据。确的协议,描述了在达到或者没有达到SLO之后的后果。就可以将更多的力量投入到扩大服务规模的工程工作上去,或者是进行下一代的服务的。SLI中过于复杂的汇总模式可能会掩盖某种系统性能的变化,同时也更难以理解。虽然100%的“可用性”是不可能实现的,但是接近1。
2023-01-03 21:08:03
387
原创 SRE-Google运维解密随记-1
增加现有容量经常需要启动新的实例甚至是整个集群,这通常需要大幅度修改现有的集群配置(配置文件、负载均衡、网络等),同时还要执行一系列测试,确保新上线的容量可以正确地服务用户。虽然不论多么完备的“运维手册”也无法替代人的创新思维,但 是在巨大的时间压力和产品压力下,运维手册中记录的清晰调试步骤和分析方法对处理 问题的人是不可或缺的。、一个业务的容量规划,不仅仅要包括自然增长(随着用户 使用量上升,资源用量也上升),也需要包括一些非自然增长的因素(新功能的发布、商业推广,以及其他商业因素在内)。
2022-12-31 23:01:11
519
原创 容器操作基础命令随记
容器操作基础命令命令周期一次性启动容器docker run一次性运行容器,退出后立即删除,用于测试创建容器后直接进入并退出守护式容器:启动前台守护式进程启动后台守护式容器默认容器重启宿主机不会自动启动,需要设置开机自启–privileged选项使用该参数,container内的root拥有真正的root权限。否则,container内的root只是外部的一个普通用户权限。privileged启动的容器,可以看到很多host上的设备,并且可以执行mount。甚至允许你在docker容器中启动dock
2022-12-05 22:21:59
671
原创 docker镜像管理
docker镜像管理镜像结构和原理镜像就是创建容器的模版,含有容器启动所需要的文件系统及所需要的内容,因此镜像主要用于方便和快速创建启动容器镜像结构:一个典型的 Linux文件系统由 bootfs 和 rootfs 两部分组成bootfs(boot file system) 主要包含bootloader和kernel,bootloader主要用于引导加载 kernel,Linux刚启动时会加载bootfs文件系统,当boot加载完成后,kernel 被加载到内存中后接管系统的控制权,bootfs会被 um
2022-12-05 16:27:38
549
原创 docker安装和info信息
docker容器的历史:1、Chroot Jail就是我们常见的 chroot 命令的用法。它在 1979 年的时候就出现了,被认为是最早的容器化技术之一。它可以把一个进程的文件系统隔离起来。2、The FreeBSD JailFreebsd Jail 实现了操作系统级别的虚拟化,它是操作系统级别虚拟化技术的先驱之一。3、Linux VServer使用添加到 Linux 内核的系统级别的虚拟化功能实现的专用虚拟服务器。4、Solaris Containers它也是操作系统级别的虚拟化技术,专为 X86 和
2022-12-05 10:36:16
794
原创 sed命令的使用
在一般sed的用法中,所有来自stdin的内容一般都会被列出到屏幕上。但如果加上-n参数后,则只有经过sed特殊处理的那一行(或者动作)才会被列出来。更多sed使用方式参考:https://www.jb51.net/article/194232.htm。直接将 sed 的动作写在一个文件内,-f filename则可以执行filename内的sed命令。需求:将“This is a big test”中的“big”改为“small”直接在指令列模式上进行 sed 的动作编辑。利用sed删除某行内容。
2022-11-17 12:01:35
324
原创 linux 环境命令随记
系统hash表未空,当外部命令执行时,默认会从path路径下寻找命令,找到后会将这条命令的路径记录到hash表中,当再次使用该命令时,shell解释器首先会查看hash表,存在将执行之,如果不存在降回去PATH路径下寻找,利用hash缓存表可大大提高命令的调用速率。GNU Bourne-Again Shell(bash)是GNU计划中重要的工具软件之一,目前也是linux标准的shell,也sh兼容。内部命令:由shell自带,而却通过命令形式提供,用户登录后自动加载并常驻内存中。
2022-10-19 13:50:23
330
原创 docker审计日志过大导致磁盘IO
2、如果有类似下图的回显,则说明存在该问题,需要进行修复,如果无回显则说明节点不受此问题影响。节点发生磁盘io 节点审计日志量较大,由于操作系统内核缺陷,会低概率出现io卡主。root管理员用户登录节点。验证:执行2、部分命令。...
2022-08-10 21:16:42
769
原创 卸载rancher出现的问题
卸载rancher出现如下报错检查apiservice,并将对应的异常apiservice删除serviceaccount 无法创建secrct存在准入控制器导致,删除准入控制器
2022-06-26 16:14:11
1148
原创 随手笔记:pod一直处于terminating状态
pod 状态处于terminating可能原因:磁盘爆满存在“i”文件属性docker 17的bug存在 finalizers低版本 kubelet list-watch 的bugdocker与 contained的状态不同步Daemonset Controller 的 BUG最常见的多为存在finalizers资源导致pod内的容器虽被驱逐kill但是任然有容器在运行以上问题处理请参考文档连接https://www.bookstack.cn/read/kubernetes-pract
2022-03-26 01:29:38
2659
原创 docker 和 k8s 组件和构建流程
docker 三大组件容器 - 基于镜像运行出来的业务环境镜像 - 基于手工部署好的业务环境,打包的镜像文件仓库 - 镜像文件保存的位置docker构建容器通过高阶运行时和低阶运行时高阶运行时-----提供快捷方便方式创建容器 containerd低阶运行时-----主要给内核提供使用,创建容器本身即runccontainerd和runc之间有docker-shimkubernetes构建容器kubelet > cri-containerdd > dockershim &g
2022-03-24 23:39:34
1063
原创 k8s hpa无法获取数据问题
问题:k8s hpa failed to get cpu utilization: missing request for cpuHPA的监控数据current字段显示为unknownkubectl describe hpa activator -n knative-servingName: activatorNamespace:
2021-12-08 10:24:56
2062
原创 dockr pull 无法拉取镜像提示找不到注册表
failed to pull image registry.cn-hangzhou.aliyuncs.com/google_containers/coredns:v1.8.0: output: Error response from daemon: manifest for registry.cn-hangzhou.aliyuncs.com/google_containers/coredns:v1.8.0 not found: manifest unknown: manifest unknown原因:地址
2021-11-22 10:36:39
2233
原创 k8s节点状态异常思路
要解决和了解节点状态为何会发生异常需要先了解k8s体系组件的基本知识与原理在k8s容器集群运行过程,时长遇到节点运行状态异常的问题和因为组件异常、系统内核死锁、资源不足等原因引起节点状态不可知。该问题可能的原因有:1.节点停机2.节点组件kubelet异常3.节点docker异常4.节点的systemd的版本过低触发pleg的bug (低版本的systemd (67版本之前),dbus的cookie溢出,导致docker、kubelet组件无法正常运行,包括runc 夯死等5.网络有拦截6.
2021-11-14 22:55:41
4081
原创 asm服务网格基本概念-备忘笔记
asm基本概念托管服务网格(Managed Service Mesh)由服务网格 ASM 创建并托管 Istio 的控制平面。具备简单、低成本、高可用、无需运维管理 Istio 控制平面的特点。控制平面(Control Plane)从架构设计上来看,Istio 服务网格逻辑上分为控制平面和数据平面两部分。控制平面负责管理和配置代理,从而实现路由流量。数据平面(Data Plane)数据平面由一组以 Sidecar 方式部署的智能代理(Envoy)组成,负责调节和控制微服务以及 Mixer 之间所
2021-10-20 17:03:19
728
1
原创 东西流量和南北流量&Service Mesh和API Gateway的关系
服务网格中的南北流量和东西流量参考网上是这么说的:在Service Mesh微服务架构中,我们常常会听到东西流量和南北流量两个术语。南北流量(NORTH-SOUTH traffic)和东西流量(EAST-WEST traffic)是数据中心环境中的网络流量模式。假设我们尝试通过浏览器访问某些Web应用。Web应用部署在位于某个数据中心的应用服务器中。在多层体系结构中,典型的数据中心不仅包含应用服务器,还包含其他服务器,如负载均衡器、数据库等,以及路由器和交换机等网络组件。假设应用服务器是负载均衡器的
2021-10-20 16:43:22
3069
2
原创 解决应用和节点oom的问题。
解决应用和节点oom的问题。如果设置了应用的resource limit 还是出现oom,建议考虑升级节点内存配置来承载更高的内存使用量。可以参考下这篇文章 https://blog.csdn.net/Jerry_Pan1990/article/details/101773313另外使用容器垂直伸缩(VPA) 和 resource-controller组件动态修改Pod资源上限 可以有效改善OOM的情况。https://help.aliyun.com/document_detail/173702.h
2021-10-12 09:19:33
356
原创 k8s、docker和内核的关系
很多同学天天嚷嚷的喊k8和内核的关系是什么,事实上内核和k8s关系不大,这个关系说的是docker和内核的关系,另外就是k8s kubelet和systemd的关系。Docker是世界领先的软件容器平台什么是容器?先来看看容器较为官方的解释:一句话概括容器:容器就是将软件打包成标准化单元,以用于开发、交付和部署。容器镜像是轻量的、可执行的独立软件包 ,包含软件运行所需的所有内容:代码、运行时环境、系统工具、系统库和设置。容器化软件适用于基于Linux和Windows的应用,在任何环境中都能够始终
2021-09-16 14:05:20
1599
原创 py-web 变量、运算符、赋值、转义、获取用户交互
python介绍:Python是一种面向对象、解释型、多用途设计语言,具有很丰富和强大的库,语法简洁,强制用空格作为语法缩进,能够完成快速项目开发,相比传统语言开发效率提高数倍。应用领域:系统运维、网站开发、科学计算、爬虫、人工智能等Web框架:• Django(最流行)• Flask(轻量级)• Tornado(异步)学习Python编程:• Python官方文档:https://www.python.org/doc• iPython:升级版的python解释器• PyCharm:一款
2021-09-13 22:43:34
227
转载 linux开机启动过程
整个过程基本可以分为BIOS–>MBR(GRUB)–>Kernel–>Init–>Runlevel。BIOSBIOS(Basic Input/Output System),基本输入输出系统,该系统存储于主板的ROM芯片上,计算机在开机时,会最先读取该系统,然后会有一个加电自检过程,这个过程其实就是检查CPU和内存,计算机最基本的组成单元(控制器、运算器和存储器),还会检查其他硬件,若没有异常就开始加载BIOS程序到内存当中。详细的BIOS功能,这边就不说了,BIOS主要的一个功
2021-09-11 19:43:23
174
原创 开机提示grub
GRUB是多启动规范的实现,它允许用户可以在计算机内同时拥有多个操作系统,并在计算机启动时选择希望运行的操作系统。GRUB可用于选择操作系统分区上的不同内核,也可用于向这些内核传递启动参数。修复参考文章地址:https://www.linuxprobe.com/boot-grub.html...
2021-09-11 19:31:16
344
转载 分析容器退出状态码
Pod status 状态解释 [1]CrashLoopBackOff:容器退出,kubelet正在将它重启InvalidImageName:无法解析镜像名称ImageInspectError:无法校验镜像ErrImageNeverPull:策略禁止拉取镜像ImagePullBackOff:镜像正在重试拉取RegistryUnavailable:连接不到镜像中心ErrImagePull:通用的拉取镜像出错CreateContainerConfigError:不能创建kubelet使用的容器配
2021-09-11 19:12:30
2387
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人