自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(138)
  • 收藏
  • 关注

原创 【安全】linux系统中木马的排查过程

【安全】linux系统中木马的排查过程├── rc1.d│ ├── K01jenkins -> ../init.d/jenkins│ ├── K50netconsole -> ../init.d/netconsole│ ├── K90network -> ../init.d/network│ ├── S97VsystemsshMdt -> /etc/init.d/VsystemsshMdt # 这个没有│ └── S99selinux -> /etc/init.d/

2024-04-24 11:59:30 278

原创 【es】es拉起不来,报内存错误,需要进行参数优化

【es】es拉起不来,报内存错误,需要进行参数优化There is insufficient memory for the Java Runtime Environment to continue常用的配置在两个文件里,分别是 elasticsearch.yml 和 jvm.options(配置内存)  jvm.options主要是进行内存相关配置,elasticsearch默认给的1g,官方建议分配给es的内存不要超出系统内存的50%,预留一半给Lucene,因为Lucene会缓存segment数

2024-04-24 09:26:18 237

原创 【Terraform实战】如何从头自动起一个nginx实例

【Terraform实战】如何从头自动起一个nginx实例并且使用module封装nginx服务,方便后面直接挑用module

2024-04-22 11:53:52 327 1

原创 【监控zabbix】zabbix监控误报-参数优化

【监控zabbix】zabbix监控误报-参数优化1.检查server机器的性能,有没有出现负载过高的情况2.检查server的日志是否出现不合理的信息3.进行server的参数优化Timeout参数优化:尽可能都调大一些,以及一致相差不多。StartPollers参数优化:根据自身机器的性能开多点进行可以提高处理速度。StartPollersUnreachable参数优化:这个尽量大一些,不要过小,除非你是具有proxy,可以按照proxy的个数进行调整,否则尽量大一些,避免idc自身网络不好

2024-04-22 10:40:34 261 1

原创 【linux】centos7 开机 进单用户模式修改root密码

【linux】centos7 开机 进单用户模式修改root密码2.在linux16 行尾添加 rd.break, 添加完后 ctrl + x 重新启动进去微型系统3.现在系统的信息挂在了 这个微型系统的 /sysroot下,而且没有写权限mount -o remount,rw /sysroot # 添加读写权限-如果碰到盘掉,挂载失败无法进入系统可以在这里修改/sysroot/etc/fstab文件,注释挂载的盘,留下系统盘,即可进入系统4.切换系统环境 chroot /sysroot

2024-04-17 16:25:52 332

原创 【shell监控】超级实用的centos7系统下 监控shell脚本

超级实用的centos7系统下 监控shell脚本services=("httpd" "mysql" "sshd")for service in "${services[@]}"; do if systemctl is-active --quiet $service; then echo "$service 服务正在运行" else echo "$service 服务未运行" fidone

2024-04-08 18:41:24 204

原创 【linux】centos7下部署openvpn专用隧道

【linux】centos7下部署openvpn专用隧道remote xxx 1777 #openvpn服务器IP地址端口号resolv-retry infinite #断线自动重新连接,在网络不稳定的情况下非常有用nobind #不绑定本地特定的端口号ca /Users/apple/Downloads/$1/ca.crt #指定CA证书的文件路径cert /Users/apple/Downloads/$1/$1.crt #指定当前客户端的证书文件路径key /Users/a

2024-04-08 18:13:12 293

原创 【linux】ubuntu ib网卡驱动如何适配

【linux】ubuntu ib网卡驱动如何适配

2024-04-03 15:18:33 530

原创 【ceph】配置 ceph dashboard 详细配置过程

【ceph】配置 ceph dashboard 详细配置过程

2024-03-18 17:37:46 1060

原创 【ceph】ceph中osd报错,have spurious read error

【ceph】ceph中osd报错,have spurious read error其实ceph的很多报错的排障过程都是这样:硬件(cpu、内存、磁盘) --- 网络 --- 具体到某个组件的日志基本上都是盘坏了(可以使用smartctl去查看盘状态),直接换盘就好。

2024-03-14 16:41:20 533

原创 【infiniband监控】grafana变量使用细化优化监控指标

【infiniband监控】grafana变量使用细化优化监控指标背景:由于grafana下载的模版的dashbord有些模块是所有交换机的数据进行top10的,那么如果需要单独看某台交换机的数据要怎么看呢?怎么做到变量的形式去方便日常的一个查看。

2024-03-08 18:13:49 848

原创 【sw网络监控】通过snmp协议相关的snmp-exporter(收集交换机网络监控数据)+ promethus + grafana

【sw网络监控】通过snmp协议相关的snmp-exporter(收集交换机网络监控数据)+ promethus + grafana背景:公司需要监控交换机的端口情况以及更好地去实现告警机制,就用到了这个监控结构模式,方便部署,轻盈。步骤:要配置Prometheus的Exporter以从IP管理口地址为192.168.1.250的交换机中收集数据,您需要按照以下步骤进行操作:

2024-03-08 17:50:10 1183

原创 【ceph】ceph关于清洗数据scrub的参数分析

【ceph】ceph关于清洗数据scrub的参数分析"osd_scrub_max_interval": "2592000.000000":表示数据清洗的最大时间间隔为 2592000 秒,即 30 天。osd_scrub_max_intervalosd_deep_scrub_intervalosd_scrub_load_thresholdosd_scrub_chunk_max # 针对小文件多,可以调整大osd_max_scrubs # 建议不要超过10

2024-01-24 14:42:43 629

原创 【ceph】ceph如何排查哪个osd曾经down过,超级实用

【ceph】ceph如何排查哪个osd曾经down过,超级实用这里附加一下:集群是如何将一个osd进行mark out的:判断原理:osd之间都会进行心跳检查,都会向mon打小报告如果检查到某个osd不行,这个小报告的数量达到某个阈值之后集群就会进行mark out操作相关日志:参数:mon_osd_down_out_intervalmon_osd_min_down_reporters查看命令:# ceph daemon osd.0 config show | gre

2024-01-24 11:43:32 1119

原创 【ceph】在虚拟环境中需要给osd所在的虚拟盘扩容操作

【ceph】在虚拟环境中需要给osd所在的虚拟盘扩容操作一、正常lv扩容操作lvextend -L +2G mylv二、lv正常扩容之后,只是系统同步了盘大小,而osd并没有同步,还需要进行osd同步sudo ceph-bluestore-tool --path --dev-expand

2024-01-12 15:33:38 1287

原创 【ceph】如何将osd的内容挂载出来---ceph-objectstore-tool 实现

【ceph】如何将osd的内容挂载出来---ceph-objectstore-tool 实现需要看到osd里面还有哪些数据内容操作流程1.先stop 对应osd2.ceph-objectstore-tool --op fuse --data-path /var/lib/ceph/osd/ceph-xx/ --mountpoint /xxx/

2024-01-12 15:28:55 674

原创 【ceph】使用 upmap 在 OSD 上手动重新平衡数据,比前面用reweight、balance香多了

【ceph】使用 upmap 在 OSD 上手动重新平衡数据,比前面用reweight、balance香多了要求版本:L版以上centos系统:ceph osd getmap -o osd_maposdmaptool --test-map-pgs --pool 5osd_map#这里6是我的数据盘pool的id号,自行寻找osdmaptool osd_map--upmap output_upmap--upmap-pool mydata --upmap-max 100 --upmap

2024-01-04 16:07:00 1414

原创 【ceph】pg状态不正常,Degraded data redundancy: 460/77222938 objects degraded (0.001%), 11 pgs degraded

【ceph】pg状态不正常,Degraded data redundancy: 460/77222938 objects degraded (0.001%), 11 pgs degraded根据信息,Ceph 集群的健康状态显示为HEALTH_WARN,并且存在数据冗余度降低的警告。具体的警告信息是:460/76950244 个对象降级(0.001%),11 个降级的 PG(Placement Group),20 个大小不足的 PG。警告信息中提到了一些pg(Placement Group)被标

2024-01-04 11:56:55 783

原创 【网络】华为交换机排查收发光情况以及思路

【网络】华为交换机排查收发光情况以及思路1.先找到自己的专线连腾讯云的端口[~hw]display current-configuration2.知道之后查看端口:[~hw]dis int brief发现是2/0/4 的端口出现的inerror可以先把这个报错端口shutdown,然后申请一下去机房看看是尾纤还是模块问题

2023-12-26 12:10:37 778

原创 【运维面试100问】(十三)谈谈session和cookic的区别

【运维面试100问】(十三)谈谈session和cookic的区别1.概念1.1 Session:存储在服务器端,保存用户名、登陆状态等信息。1.2 Cookies:由服务器下发给客户端,保存在客户端的一个文件里。保存的内容主要包括:SessionID。区别2.1 cookie数据存放在客户的浏览器上,session数据放在服务器上.2.2 cookie不是很安全,别人可以分析存放在本地的COOKIE并进行COOKIE欺骗考虑到安全应当使用session。2.3 设置cookie时间可以使c

2023-12-22 10:02:08 868

原创 【运维面试100问】(十二)你对nginx做过哪些优化?

【运维面试100问】(十二)你对nginx做过哪些优化?如何自定义返回给客户端的404错误页面如何查看服务器状态信息如果客户端访问服务器提示“Too many open files”如何解决如何解决客户端访问头部信息过长的问题如何让客户端浏览器缓存数据客户机访问此Web服务器验证效果:使用ab压力测试软件测试并发量编写测试脚本生成长头部信息的访问请求

2023-12-21 17:39:06 426

原创 【ceph】pg down的处理流程

【ceph】pg down的处理流程

2023-12-21 17:26:57 1230

原创 【运维面试100问】(十一)淡淡I/O过程

【运维面试100问】(十一)淡淡I/O过程通过这样的一个复杂过程,一次请求就完成了简单来说就是:用户请求——》送达用户空间——〉系统调用——》内核空间——〉内核到磁盘上读取图片资源——》返回到用户空间——〉响应给用户1.客户端发起情况到服务器网卡2.服务器网卡接受到请求后转交给内核处理3.内核根据请求对应的套接字,将请求交给工作在用户空间的Web服务器进程4.Web服务器进程根据用户请求,向内核进行系统调用,申请获取相应资源(如:客户端获取图片)

2023-12-20 11:05:36 455

原创 【运维面试100问】(十)你有对系统内核参数优化的经历吗?

【运维面试100问】(十)你有对系统内核参数优化的经历吗?一般问完你参与过的优化之后,面试官可能会追问:例如高并发内核参数优化-Iptables相关-单进程最大打开文件数限制-内核TCP参数方面-内核其他TCP参数说明-IO事件分配机制

2023-12-20 10:46:42 889

原创 【运维面试100问】(九)了解Raid嘛?

【运维面试100问】了解Raid嘛?1. RAID 0:条带化(Striping)模式,将数据均匀分布在多个硬盘上,提供了更高的性能和容量,但没有冗余备份功能。RAID 0适用于需要高速数据传输和临时存储的场景,但对数据安全性要求不高。提高读写效率,至少需要两块磁盘2. RAID 1:镜像(Mirroring)模式,将数据同时写入两个硬盘,提供了冗余备份和容错能力。RAID 1可以在一个硬盘故障时继续提供数据访问,但容量利用率较低,只有总容量中的一半可用。实现磁盘设备的冗余备份,至少需要两块磁盘

2023-12-19 16:40:42 381

原创 【运维日常】nginx 413 Request Entity Too Large

【运维日常】nginx 413 Request Entity Too Large

2023-12-19 16:32:27 485

原创 【GPU监控】Gpu-dcgm-exporter 监控

【GPU监控】Gpu-dcgm-exporter 监控

2023-12-18 14:45:18 1253

原创 【运维面试100问】(八)如何手动释放内存

【运维面试100问】(八)如何手动释放内存$ echo 1 > /proc/sys/vm/drop_caches$ echo 2 > /proc/sys/vm/drop_caches$ echo 3 > /proc/sys/vm/drop_caches

2023-12-07 17:10:05 166

原创 【运维面试100问】(七)ceph基础题面试

【运维面试100问】(七)ceph基础题面试ceph的概念,各个角色,怎么使用,举例12台机器怎么分配mon/mgr/osd这些,最大宕机数多少,以及纠错码的含义

2023-12-07 17:03:44 826

原创 【ceph】ceph的硬件使用磁盘柜有多路径,节点显示有多个盘符的时候,应该怎么操作去创建osd呢?

【ceph】ceph的硬件使用磁盘柜有多路径,节点显示有多个盘符的时候,应该怎么操作去创建osd呢?

2023-12-07 16:43:28 212

原创 【ceph】ceph生产常见操作之一---ceph扩容以及注意事项

【ceph】ceph生产常见操作之一---ceph扩容以及注意事项扩容过程主要分为4步(文档有具体描述):(1)业务规模的评估(2)扩容前的准备工作(包括环境的检查,pg数的计算,pg分布的统计)(3)扩容过程中的故障处理(mon、osd进程故障,pg状态异常故障)(4)扩容完的收尾动作(统计pg的分布图,调节迁移的速度等)二、迁移过程中的状态详解Remapped、backfill等三、迁移速度调整

2023-12-07 16:35:36 826

原创 【ceph】传统分区和vg lvm 创建osd

【ceph】传统分区和vg lvm 创建osd

2023-12-05 16:45:30 295

原创 【ceph】ceph集群中调参工程师必备命令:ceph config help <参数>

【ceph】ceph集群中调参工程师必备命令:ceph config help

2023-12-05 16:33:01 150

原创 【运维面试100问】(六)buffer和cache的区别

【运维面试100问】(六)buffer和cache的区别cache是cpu与内存之间的,buffer是内存与磁盘间的,都是为了解决速度不对等的问题buffer是即将要被写入磁盘的,而cache是被从磁盘读出来的

2023-11-24 17:12:40 465

原创 【运维面试100问】(五)讲讲你对于cpu使用率和负载的理解,为什么有时候cpu使用率低而cpu负载确很高

【运维面试100问】(五)讲讲你对于cpu使用率和负载的理解,为什么有时候cpu使用率低而cpu负载确很高首先cpu负载的概念原理是可以理解成队列的,如果你进程线程小任务多了,自然负载就高例如 你的机器只有4h,而你开了30个任务,远远大于4个任务了,负载必然很大这个时候你的任务又不吃cpu资源的,所以使用率也就低了。相信经过这么讲你大概理解了,为什么cpu使用率低,而负载会高的原因。

2023-11-24 17:02:48 190

原创 【ceph】如何打印一个osd的op流程,排查osd在干什么

【ceph】如何打印一个osd的op流程,排查某个osd具体在干什么

2023-11-24 16:15:51 281

原创 【ceph】ceph集群 slow req 问题剖析:30 slow requests are blocked > 32 sec. Implicated osds 186,满满都是干货

【ceph】ceph集群 slow req 问题剖析:30 slow requests are blocked > 32 sec. Implicated osds 186,满满都是干货1.硬件问题:dmest -T / smartctl -a 以及查看osd日志排查2.网络问题:自己排查自己机器环境中的网络是否不稳定一般使用iperf 或者 长ping 以及 http 响应时间 使用time3.时间同步ntp也要检查4.上面问题都排除外,大概率是shard分配不合理导致osd压力

2023-11-24 15:07:03 415

原创 【ceph】ceph集群存储池如何设计规则rule 让 index 的索引数据都落盘到ssd盘上

【ceph】ceph集群存储池如何设计规则rule 让 index 的索引数据都落盘到ssd盘上先在这个ssd root里新建规则/usr/bin/ceph osd crush rule create-replicated replicated-1 ssd-index host ssd然后把那些pool迁移过去/usr/bin/ceph osd pool set POOLNAME crush_rule replicated-1

2023-11-23 15:29:11 209

原创 【ceph】ceph集群的故障域是怎么快速修改导入导出

【ceph】ceph集群的故障域是怎么快速修改导入导出ceph osd getcrushmap -o crushtool -d -o crushtool -c -o ceph osd setcrushmap -i

2023-11-20 18:17:25 419

原创 【运维日常】lvm中的lv是如何扩容的---直接干

【运维日常】lvm中的lv是如何扩容的---直接干要扩展逻辑卷(Logical Volume,简称 LV),你可以按照以下步骤进行操作:确保你有足够的可用空间来扩展 LV。这可以是未分配的物理卷空间或者通过扩展现有物理卷来获得的空间。使用lvdisplay命令来查看当前的 LV 信息,确定你要扩展的 LV 的名称和路径。使用lvextend命令来扩展 LV。命令的基本语法如下:

2023-11-20 15:47:04 384

Linux 自启动过程-利于了解系统启动过程

启动第一步--加载BIOS 当你打开计算机电源,计算机会首先加载BIOS信息,BIOS信息是如此的重要,以至于计算机必须在最开始就找到它。这是因为BIOS中包含了CPU的相关信息、设备启动顺序信息、硬盘信息、内存信息、时钟信息、PnP特性等等。在此之后,计算机心里就有谱了,知道应该去读取哪个硬件设备了。 启动第二步--读取MBR 众所周知,硬盘上第0磁道第一个扇区被称为MBR,也就是Master Boot Record,即主引导记录,它的大小是512字节,别看地方不大,可里面却存放了预启动信息、分区表信息。 系统找到BIOS所指定的硬盘的MBR后,就会将其复制到0×7c00地址所在的物理内存中。其实被复制到物理内存的内容就是Boot Loader,而具体到你的电脑,那就是lilo或者grub了。 启动第三步--Boot Loader Boot Loader 就是在操作系统内核运行之前运行的一段小程序。通过这段小程序,我们可以初始化硬件设备、建立内存空间的映射图,从而将系统的软硬件环境带到一个合适的状态,以便为最终调用操作系统内核做好一切准备。 Boot Loader有若干种,其中G

2023-08-02

【shell脚本】shell脚本之条件判断if、for与while循环(shell脚本基础学习二)

【shell脚本】shell脚本之条件判断if、for与while循环(shell脚本基础学习二) shell中的if 单分支 if 条件测试 ;then 命令序列 fi 双分支 if 条件测试 ;then 命令序列1 else 命令序列2 fi 多分支 if 条件测试 ;then 命令序列1 elif 条件测试 ;then 命令序列2 else 命令序列3 fi for循环: for 变量名称 in 值1 值2 值3...... do 执行指令 done ------------------------- 1, 循环次数,和值有关 2, 循环时的变量,也和值有关 ------------------------- #!/bin/bash for i in {1..10} 多个值的简单写法 do echo $i done --------------------------------- #!/bin/bash a=10 for i in {1..$a} 大括号不支持套用变量 do echo $i done -----------------------------

2023-07-18

【shell脚本】shell脚本之概念、运行方式、变量的使用、交互式脚本、运算(shell脚本基础学习一)

【shell脚本】shell脚本之概念、运行方式、变量的使用、交互式脚本、运算(shell脚本基础学习一) shell概念 --- 编写执行--- 变量 --- 运算---  shell脚本 /bin/bash 默认解释器 cat /etc/shells 查看所有解释器 yum -y install ksh 安装新解释器 bash优点 tab建,快捷键,历史记录,管道符,重定向 -------------------------------------------------------------------------- 规范的shell脚本 1,声明解释器 2,注释脚本功能,变量含义等等 3,执行代码 -------------------------------------------------------------------------- 脚本的运行方式 1, 添加x执行权限 chmod +x test1.sh 2, 使用解释器执行, 开启子进程 bash test1.sh 3, 使用当前解释器执行,不开启子进程 source test1.sh

2023-07-18

h3c - er8300路由使用手册

h3c 路由使用手册

2023-04-11

Mellanox牌子-ib交换机使用手册-for 4700, 4200, 4036E, & 4036/2036

Grid Director 4000 Family User Manual for 4700, 4200, 4036E, & 4036/2036

2023-04-11

生产环境办公网网络问题排查思路以及实战

在企业中会经常遇到一些办公网网络问题, 这篇问题教大家如何去排查企业生产中遇到的网络问题,以及一些思路和实战 这次排查的对象是h3c路由器和ap交换机构成的一个小网络架构, 遇到网络不稳定,可能存在广播风暴,需要重新划分网络vlan解决问题, 希望对大家有帮助。

2023-03-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除