- 博客(138)
- 收藏
- 关注
原创 【安全】linux系统中木马的排查过程
【安全】linux系统中木马的排查过程├── rc1.d│ ├── K01jenkins -> ../init.d/jenkins│ ├── K50netconsole -> ../init.d/netconsole│ ├── K90network -> ../init.d/network│ ├── S97VsystemsshMdt -> /etc/init.d/VsystemsshMdt # 这个没有│ └── S99selinux -> /etc/init.d/
2024-04-24 11:59:30 278
原创 【es】es拉起不来,报内存错误,需要进行参数优化
【es】es拉起不来,报内存错误,需要进行参数优化There is insufficient memory for the Java Runtime Environment to continue常用的配置在两个文件里,分别是 elasticsearch.yml 和 jvm.options(配置内存) jvm.options主要是进行内存相关配置,elasticsearch默认给的1g,官方建议分配给es的内存不要超出系统内存的50%,预留一半给Lucene,因为Lucene会缓存segment数
2024-04-24 09:26:18 237
原创 【Terraform实战】如何从头自动起一个nginx实例
【Terraform实战】如何从头自动起一个nginx实例并且使用module封装nginx服务,方便后面直接挑用module
2024-04-22 11:53:52 327 1
原创 【监控zabbix】zabbix监控误报-参数优化
【监控zabbix】zabbix监控误报-参数优化1.检查server机器的性能,有没有出现负载过高的情况2.检查server的日志是否出现不合理的信息3.进行server的参数优化Timeout参数优化:尽可能都调大一些,以及一致相差不多。StartPollers参数优化:根据自身机器的性能开多点进行可以提高处理速度。StartPollersUnreachable参数优化:这个尽量大一些,不要过小,除非你是具有proxy,可以按照proxy的个数进行调整,否则尽量大一些,避免idc自身网络不好
2024-04-22 10:40:34 261 1
原创 【linux】centos7 开机 进单用户模式修改root密码
【linux】centos7 开机 进单用户模式修改root密码2.在linux16 行尾添加 rd.break, 添加完后 ctrl + x 重新启动进去微型系统3.现在系统的信息挂在了 这个微型系统的 /sysroot下,而且没有写权限mount -o remount,rw /sysroot # 添加读写权限-如果碰到盘掉,挂载失败无法进入系统可以在这里修改/sysroot/etc/fstab文件,注释挂载的盘,留下系统盘,即可进入系统4.切换系统环境 chroot /sysroot
2024-04-17 16:25:52 332
原创 【shell监控】超级实用的centos7系统下 监控shell脚本
超级实用的centos7系统下 监控shell脚本services=("httpd" "mysql" "sshd")for service in "${services[@]}"; do if systemctl is-active --quiet $service; then echo "$service 服务正在运行" else echo "$service 服务未运行" fidone
2024-04-08 18:41:24 204
原创 【linux】centos7下部署openvpn专用隧道
【linux】centos7下部署openvpn专用隧道remote xxx 1777 #openvpn服务器IP地址端口号resolv-retry infinite #断线自动重新连接,在网络不稳定的情况下非常有用nobind #不绑定本地特定的端口号ca /Users/apple/Downloads/$1/ca.crt #指定CA证书的文件路径cert /Users/apple/Downloads/$1/$1.crt #指定当前客户端的证书文件路径key /Users/a
2024-04-08 18:13:12 293
原创 【ceph】ceph中osd报错,have spurious read error
【ceph】ceph中osd报错,have spurious read error其实ceph的很多报错的排障过程都是这样:硬件(cpu、内存、磁盘) --- 网络 --- 具体到某个组件的日志基本上都是盘坏了(可以使用smartctl去查看盘状态),直接换盘就好。
2024-03-14 16:41:20 533
原创 【infiniband监控】grafana变量使用细化优化监控指标
【infiniband监控】grafana变量使用细化优化监控指标背景:由于grafana下载的模版的dashbord有些模块是所有交换机的数据进行top10的,那么如果需要单独看某台交换机的数据要怎么看呢?怎么做到变量的形式去方便日常的一个查看。
2024-03-08 18:13:49 848
原创 【sw网络监控】通过snmp协议相关的snmp-exporter(收集交换机网络监控数据)+ promethus + grafana
【sw网络监控】通过snmp协议相关的snmp-exporter(收集交换机网络监控数据)+ promethus + grafana背景:公司需要监控交换机的端口情况以及更好地去实现告警机制,就用到了这个监控结构模式,方便部署,轻盈。步骤:要配置Prometheus的Exporter以从IP管理口地址为192.168.1.250的交换机中收集数据,您需要按照以下步骤进行操作:
2024-03-08 17:50:10 1183
原创 【ceph】ceph关于清洗数据scrub的参数分析
【ceph】ceph关于清洗数据scrub的参数分析"osd_scrub_max_interval": "2592000.000000":表示数据清洗的最大时间间隔为 2592000 秒,即 30 天。osd_scrub_max_intervalosd_deep_scrub_intervalosd_scrub_load_thresholdosd_scrub_chunk_max # 针对小文件多,可以调整大osd_max_scrubs # 建议不要超过10
2024-01-24 14:42:43 629
原创 【ceph】ceph如何排查哪个osd曾经down过,超级实用
【ceph】ceph如何排查哪个osd曾经down过,超级实用这里附加一下:集群是如何将一个osd进行mark out的:判断原理:osd之间都会进行心跳检查,都会向mon打小报告如果检查到某个osd不行,这个小报告的数量达到某个阈值之后集群就会进行mark out操作相关日志:参数:mon_osd_down_out_intervalmon_osd_min_down_reporters查看命令:# ceph daemon osd.0 config show | gre
2024-01-24 11:43:32 1119
原创 【ceph】在虚拟环境中需要给osd所在的虚拟盘扩容操作
【ceph】在虚拟环境中需要给osd所在的虚拟盘扩容操作一、正常lv扩容操作lvextend -L +2G mylv二、lv正常扩容之后,只是系统同步了盘大小,而osd并没有同步,还需要进行osd同步sudo ceph-bluestore-tool --path --dev-expand
2024-01-12 15:33:38 1287
原创 【ceph】如何将osd的内容挂载出来---ceph-objectstore-tool 实现
【ceph】如何将osd的内容挂载出来---ceph-objectstore-tool 实现需要看到osd里面还有哪些数据内容操作流程1.先stop 对应osd2.ceph-objectstore-tool --op fuse --data-path /var/lib/ceph/osd/ceph-xx/ --mountpoint /xxx/
2024-01-12 15:28:55 674
原创 【ceph】使用 upmap 在 OSD 上手动重新平衡数据,比前面用reweight、balance香多了
【ceph】使用 upmap 在 OSD 上手动重新平衡数据,比前面用reweight、balance香多了要求版本:L版以上centos系统:ceph osd getmap -o osd_maposdmaptool --test-map-pgs --pool 5osd_map#这里6是我的数据盘pool的id号,自行寻找osdmaptool osd_map--upmap output_upmap--upmap-pool mydata --upmap-max 100 --upmap
2024-01-04 16:07:00 1414
原创 【ceph】pg状态不正常,Degraded data redundancy: 460/77222938 objects degraded (0.001%), 11 pgs degraded
【ceph】pg状态不正常,Degraded data redundancy: 460/77222938 objects degraded (0.001%), 11 pgs degraded根据信息,Ceph 集群的健康状态显示为HEALTH_WARN,并且存在数据冗余度降低的警告。具体的警告信息是:460/76950244 个对象降级(0.001%),11 个降级的 PG(Placement Group),20 个大小不足的 PG。警告信息中提到了一些pg(Placement Group)被标
2024-01-04 11:56:55 783
原创 【网络】华为交换机排查收发光情况以及思路
【网络】华为交换机排查收发光情况以及思路1.先找到自己的专线连腾讯云的端口[~hw]display current-configuration2.知道之后查看端口:[~hw]dis int brief发现是2/0/4 的端口出现的inerror可以先把这个报错端口shutdown,然后申请一下去机房看看是尾纤还是模块问题
2023-12-26 12:10:37 778
原创 【运维面试100问】(十三)谈谈session和cookic的区别
【运维面试100问】(十三)谈谈session和cookic的区别1.概念1.1 Session:存储在服务器端,保存用户名、登陆状态等信息。1.2 Cookies:由服务器下发给客户端,保存在客户端的一个文件里。保存的内容主要包括:SessionID。区别2.1 cookie数据存放在客户的浏览器上,session数据放在服务器上.2.2 cookie不是很安全,别人可以分析存放在本地的COOKIE并进行COOKIE欺骗考虑到安全应当使用session。2.3 设置cookie时间可以使c
2023-12-22 10:02:08 868
原创 【运维面试100问】(十二)你对nginx做过哪些优化?
【运维面试100问】(十二)你对nginx做过哪些优化?如何自定义返回给客户端的404错误页面如何查看服务器状态信息如果客户端访问服务器提示“Too many open files”如何解决如何解决客户端访问头部信息过长的问题如何让客户端浏览器缓存数据客户机访问此Web服务器验证效果:使用ab压力测试软件测试并发量编写测试脚本生成长头部信息的访问请求
2023-12-21 17:39:06 426
原创 【运维面试100问】(十一)淡淡I/O过程
【运维面试100问】(十一)淡淡I/O过程通过这样的一个复杂过程,一次请求就完成了简单来说就是:用户请求——》送达用户空间——〉系统调用——》内核空间——〉内核到磁盘上读取图片资源——》返回到用户空间——〉响应给用户1.客户端发起情况到服务器网卡2.服务器网卡接受到请求后转交给内核处理3.内核根据请求对应的套接字,将请求交给工作在用户空间的Web服务器进程4.Web服务器进程根据用户请求,向内核进行系统调用,申请获取相应资源(如:客户端获取图片)
2023-12-20 11:05:36 455
原创 【运维面试100问】(十)你有对系统内核参数优化的经历吗?
【运维面试100问】(十)你有对系统内核参数优化的经历吗?一般问完你参与过的优化之后,面试官可能会追问:例如高并发内核参数优化-Iptables相关-单进程最大打开文件数限制-内核TCP参数方面-内核其他TCP参数说明-IO事件分配机制
2023-12-20 10:46:42 889
原创 【运维面试100问】(九)了解Raid嘛?
【运维面试100问】了解Raid嘛?1. RAID 0:条带化(Striping)模式,将数据均匀分布在多个硬盘上,提供了更高的性能和容量,但没有冗余备份功能。RAID 0适用于需要高速数据传输和临时存储的场景,但对数据安全性要求不高。提高读写效率,至少需要两块磁盘2. RAID 1:镜像(Mirroring)模式,将数据同时写入两个硬盘,提供了冗余备份和容错能力。RAID 1可以在一个硬盘故障时继续提供数据访问,但容量利用率较低,只有总容量中的一半可用。实现磁盘设备的冗余备份,至少需要两块磁盘
2023-12-19 16:40:42 381
原创 【运维日常】nginx 413 Request Entity Too Large
【运维日常】nginx 413 Request Entity Too Large
2023-12-19 16:32:27 485
原创 【运维面试100问】(八)如何手动释放内存
【运维面试100问】(八)如何手动释放内存$ echo 1 > /proc/sys/vm/drop_caches$ echo 2 > /proc/sys/vm/drop_caches$ echo 3 > /proc/sys/vm/drop_caches
2023-12-07 17:10:05 166
原创 【运维面试100问】(七)ceph基础题面试
【运维面试100问】(七)ceph基础题面试ceph的概念,各个角色,怎么使用,举例12台机器怎么分配mon/mgr/osd这些,最大宕机数多少,以及纠错码的含义
2023-12-07 17:03:44 826
原创 【ceph】ceph的硬件使用磁盘柜有多路径,节点显示有多个盘符的时候,应该怎么操作去创建osd呢?
【ceph】ceph的硬件使用磁盘柜有多路径,节点显示有多个盘符的时候,应该怎么操作去创建osd呢?
2023-12-07 16:43:28 212
原创 【ceph】ceph生产常见操作之一---ceph扩容以及注意事项
【ceph】ceph生产常见操作之一---ceph扩容以及注意事项扩容过程主要分为4步(文档有具体描述):(1)业务规模的评估(2)扩容前的准备工作(包括环境的检查,pg数的计算,pg分布的统计)(3)扩容过程中的故障处理(mon、osd进程故障,pg状态异常故障)(4)扩容完的收尾动作(统计pg的分布图,调节迁移的速度等)二、迁移过程中的状态详解Remapped、backfill等三、迁移速度调整
2023-12-07 16:35:36 826
原创 【ceph】ceph集群中调参工程师必备命令:ceph config help <参数>
【ceph】ceph集群中调参工程师必备命令:ceph config help
2023-12-05 16:33:01 150
原创 【运维面试100问】(六)buffer和cache的区别
【运维面试100问】(六)buffer和cache的区别cache是cpu与内存之间的,buffer是内存与磁盘间的,都是为了解决速度不对等的问题buffer是即将要被写入磁盘的,而cache是被从磁盘读出来的
2023-11-24 17:12:40 465
原创 【运维面试100问】(五)讲讲你对于cpu使用率和负载的理解,为什么有时候cpu使用率低而cpu负载确很高
【运维面试100问】(五)讲讲你对于cpu使用率和负载的理解,为什么有时候cpu使用率低而cpu负载确很高首先cpu负载的概念原理是可以理解成队列的,如果你进程线程小任务多了,自然负载就高例如 你的机器只有4h,而你开了30个任务,远远大于4个任务了,负载必然很大这个时候你的任务又不吃cpu资源的,所以使用率也就低了。相信经过这么讲你大概理解了,为什么cpu使用率低,而负载会高的原因。
2023-11-24 17:02:48 190
原创 【ceph】ceph集群 slow req 问题剖析:30 slow requests are blocked > 32 sec. Implicated osds 186,满满都是干货
【ceph】ceph集群 slow req 问题剖析:30 slow requests are blocked > 32 sec. Implicated osds 186,满满都是干货1.硬件问题:dmest -T / smartctl -a 以及查看osd日志排查2.网络问题:自己排查自己机器环境中的网络是否不稳定一般使用iperf 或者 长ping 以及 http 响应时间 使用time3.时间同步ntp也要检查4.上面问题都排除外,大概率是shard分配不合理导致osd压力
2023-11-24 15:07:03 415
原创 【ceph】ceph集群存储池如何设计规则rule 让 index 的索引数据都落盘到ssd盘上
【ceph】ceph集群存储池如何设计规则rule 让 index 的索引数据都落盘到ssd盘上先在这个ssd root里新建规则/usr/bin/ceph osd crush rule create-replicated replicated-1 ssd-index host ssd然后把那些pool迁移过去/usr/bin/ceph osd pool set POOLNAME crush_rule replicated-1
2023-11-23 15:29:11 209
原创 【ceph】ceph集群的故障域是怎么快速修改导入导出
【ceph】ceph集群的故障域是怎么快速修改导入导出ceph osd getcrushmap -o crushtool -d -o crushtool -c -o ceph osd setcrushmap -i
2023-11-20 18:17:25 419
原创 【运维日常】lvm中的lv是如何扩容的---直接干
【运维日常】lvm中的lv是如何扩容的---直接干要扩展逻辑卷(Logical Volume,简称 LV),你可以按照以下步骤进行操作:确保你有足够的可用空间来扩展 LV。这可以是未分配的物理卷空间或者通过扩展现有物理卷来获得的空间。使用lvdisplay命令来查看当前的 LV 信息,确定你要扩展的 LV 的名称和路径。使用lvextend命令来扩展 LV。命令的基本语法如下:
2023-11-20 15:47:04 384
Linux 自启动过程-利于了解系统启动过程
2023-08-02
【shell脚本】shell脚本之条件判断if、for与while循环(shell脚本基础学习二)
2023-07-18
【shell脚本】shell脚本之概念、运行方式、变量的使用、交互式脚本、运算(shell脚本基础学习一)
2023-07-18
Mellanox牌子-ib交换机使用手册-for 4700, 4200, 4036E, & 4036/2036
2023-04-11
生产环境办公网网络问题排查思路以及实战
2023-03-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人