- 博客(54)
- 收藏
- 关注
原创 docker数据卷及数据卷容器
持久化:在容器内创建的文件及数据仅在容器的生命周期内有效,当容器被删除后,文件及数据也随之丢失。持久化可以帮助把docker内部的文件及数据映射到本地,实现备份及与宿主机或其他容器交换文件。数据卷:简称volume,用于docker容器内文件及数据的持久化。/var/lib/mysql: mysql应用的数据库及文件。/var/log/mysql : mysql应用的运行日志。/etc/my.cnf: mysql应用的配置文件。主要应用场景:简化大量容器的数据同步问题。
2024-08-27 13:39:55 535
原创 我的创作纪念日
获得了多少正向的反馈,如196赞、5评论、26291阅读量等。提示:考证,升职,加薪,迎娶白富美,走向人生巅峰。获得了138粉丝的关注。
2024-08-27 09:54:50 294
原创 Singularity容器安装与使用
singuiarily主要是适合HPC中的普通用户,因其完全兼容docker,并且具有很好权限隔离,非常适合普通用户使用。docker因大多时候需变管理员的权眼,且普通用户进行数据卷的挂载时,容易导致其他不可访问的日录也被容器内访问,安全性较差。官方镜像仓库:hps:/icloud.sylabs,.iomibray,但由于官方仓库镜像较少,一般都是使用docker镜像仓库中的镜像。权限问题:Dockerdameon使用 root用户启动,HPC场录期望使用普通用户运行容器。step1:安装基础依赖包。
2024-08-08 16:39:05 641
原创 ITIL服务管理认知与实践
ITIL(Information Technology Infrastructure Library,信息技术基础架构库)ITIL的创建旨在解决当年英国政府部门在IT服务管理中存在的混乱和低效问题,提高政府的运营效率和公众服务水平。
2024-08-08 11:17:53 152
原创 module安装和modulefile的使用
软件下载地址: • https://github.com/cea-hpc/modules/releases/• 安装命令 • apt install tclsh tcl8.6-dev (所有节点都要安装)• ./configure --prefix=/opt/software/module (共享存储目录下)• make• 环境变量设置,所有节点都需要设置此时安装完成后还是无法使用module命令加载环境变量:source /opt/software/module/init/bash。
2024-08-07 13:48:26 1027
原创 SLURM调度系统教程
SLURM(Simple Linux Utility for Resource Management)是一个开源的、用于管理和调度高性能计算(HPC)集群资源的软件工具。它主要用于在大规模计算环境中分配和管理计算任务的资源,确保高性能计算集群的有效利用。SLURM被广泛用于科学研究、工程模拟、数据分析等需要大量计算资源的领域。SLURM调度系统的主要功能和组件包括:作业调度: SLURM负责调度和分配计算任务,即作业,到集群中的计算节点上。
2024-08-07 13:33:01 1247
原创 超级计算机精度理论值公式
双精度理论峰值性能 = 28(CPU核数) x 2.7GHz(CPU频率) x 32 DP FLOPs/cycle = 2419.2 GFLOPs/s 峰值浮点计算能力。(512bit/32bit) x 2(FMA) x 2(乘和加) = 64 SP FLOPs/cycle,即每个时钟周期可以做64个单精度浮点计算。(512bit/64bit) x 2(FMA) x 2(乘和加) = 32 DP FLOPs/cycle,即每个时钟周期可以做32个双精度浮点计算。
2024-05-06 14:35:28 537
原创 zabbix硬件监控通用模版
name: ‘设备 {HOST.NAME} 模块 {#SNMPVALUE} 温度持续5分钟大于80℃’name: ‘设备 {HOST.NAME} 风扇 {#SNMPINDEX} 状态不正常’name: ‘设备 {HOST.NAME} 电源 {#SNMPINDEX} 状态不正常’name: ‘设备 {HOST.NAME} 风扇 {#SNMPINDEX} 状态不正常’name: ‘设备 {HOST.NAME} 风扇 {#SNMPINDEX} 状态不正常’name: ‘电源模块 {#SNMPVALUE} 状态’
2024-04-23 10:53:33 1120 1
原创 Linux使用Linpack测试
如果报错,可能原因有,Make.Linux_PII_CBLAS中的路径没有改对,路径要与自己实际的安装路径相符,可以一一对照,看看路径下对应的文件是否存在。也可能原因,Makefile文件格式严苛,不要随意用空格,路径前后有空格虽然看不出来,但是Makefile文件能认出来。路径特别是mpich-install的路径不要弄错,环境变量再检查检查。HPLlib :libhpl.a文件所在位置,一般都在hpl程序目录下。TOPdir :hpl程序包解压后所在的路径。2.BLAS/CBLAS/ATLAS 库。
2024-04-12 14:36:39 518
原创 zabbix分布式部署
web界面:web界面可以让用户随时随地都能够轻松的访问到zabbix,是zabbix-server的一部分,通常跟server运行在同一台物理机上。LogFile=/var/log/zabbix_server.log # 38行,指定 zabbix 日志路径。zabbix-proxy:用于分布式系统中,可以代理zabbix-server的功能,减轻server的压力。DBPassword=zabbix # 123行,指定 zabbix 数据库的密码。#安装mariaDB;
2024-03-27 11:09:27 1980
原创 PXE批量装centos7系统
打开“Kickstart 配置程序”窗口 通过桌面菜单“应用程序”–>“系统工具”–>“Kickstart” 打开 或执行 “system-config-kickstart” 命令打开。4、安装FTP服务,准备CentOS 7 安装源。2、准备Linux内核、初始化镜像。3、准备PXE引导程序。
2024-03-25 13:27:30 241
原创 OSPF工作原理
设备只有在OSPF邻居双方成功交换DD报文后才会向对方发出LSR报文。OSPF建立邻居,收集LSA,收集完成后形成邻接,用收集到的LSA,作为原材料,计算路由。基本概念:route-ID 路由器标识符,用于在一个OSPF域中的唯一地标识一台路由器。完成这3个步骤,分别会形成3张表,是OSPF邻居表,LSDB表,OSPF路由表。Route-ID的设定可以通过手工配置的方式,或者使用系统自动配置的方式。OSPF3张表:形成邻居关系,形成邻接关系,计算路由。OSPF Area用于标识一个OSPF的区域。
2024-03-18 08:55:49 263
原创 zabbix-agent客户端出现Get value from agent failed: cannot connect to Connection refused
1、zabbix出现Get value from agent failed: cannot connect to Connection refused。6、解决思路,回忆在这之前操作修改了一个配置文件,才导致这样,决定修改会来,问题解决。3、/zabbix_agent2.conf中的hostname文件保持一致,并无错误。1、去服务器重启和查看状态zabbix-agent2,发现重启失败。5、使用journalctl -xe查看并无重要信息。2、查看端口号,发现端口未启动。4、查看日志发现无主机。
2024-03-12 13:54:54 1532
原创 zabbix客户端用yum安装过后出现Unit zabbix-agent.service could not be found.
1、重启,查看状态后发现:Unit zabbix-agent.service could not be found.
2024-03-12 13:37:42 571
原创 nodup使用
nohup 命令,在默认情况下(非重定向时),会输出一个名叫 nohup.out 的文件到当前目录下,如果当前目录的 nohup.out 文件不可写,输出重定向到 $HOME/nohup.out 文件中。nohup 英文全称 no hang up(不挂起),用于在系统后台不挂断地运行命令,退出终端不会影响程序的运行。列如:nohup ./gophish &
2023-12-04 15:54:23 512
原创 NAT转换使用
Easy_IP:私网IP和公网IP是多对一的关系,直接使用路由器外网接口的IP,私网IP只对应路由器外网接口的公网IP,没有地址池概念,一般适用于不具备固定公网IP地址的场景。动态NAT:私网IP和公网IP是一对一的关系,需要定义公网地址池。私网会轮询(一个个使用)地址池中的每个公网IP,缺点是不能同时使用。NAPT:私网IP 和公网IP是多对一的关系,公网IP地址池中只定义一个公网IP,私网IP只对应一个自定义的公网IP。静态NAT:私网IP和公网IP是一对一的关系,并且需要一对一的绑定(实际中不常用)
2023-10-12 10:36:10 108
原创 使用路由器子接口
基于一个物理接口创建多个子接口,将该物理接口对接到交换机的trunk接口,即可实现使用一个物理接口为多个VLAN提供三层转发。子接口是基于路由器以太网接口所创建的逻辑接口,以物理接口ID+子接口ID进行的标识,子接口同物理接口一样可以进行三层转发。子接口不同于物理接口,可以终结携带VLAN tag的数据帧。
2023-10-11 11:13:33 1819
原创 OSPF基础了解
为优化MA网络中OSPF邻接关系,OSPF指定了三种OSPF路由器身份,DR(Designated Router,指定路由器)、BDR(Backup Designated Router,备用指定路由器)和DRother路由器。在MA网络中,如果每台OSPF路由器都与其他的所有路由器建立OSPF邻接关系,便会导致网络中存在过多的OSPF邻接关系,增加设备负担,也增加了网络中泛洪的OSPF报文数量。OSPF多区域的设计减小了LSA泛洪的范围,有效的把拓扑变化的影响控制在区域内,达到网络优化的目的。
2023-08-27 21:12:17 336
原创 环路解决方法
默认32768,优先级必须是4096的倍数,0 4096 8192 32768。优先级越高通过修改设备优先级,数字越小,越不会被阻塞。
2023-08-26 12:09:39 125
原创 网络基础小实验
DHCP 、ACL、小白教学。access:连接终端,电脑,打印机等。交换机的接口模式(三种常用的两种)再用某种技术,把隔离的用户连接起来。trunk:连接其他交换机的。步骤一:创建一个访问权限规则。先用vlan把用户隔离开。步骤二:调用这个规则。
2023-08-24 17:04:25 90 1
原创 Linux CPU占用率100%排查
2.top -Hp [pid] 定位应用进程对应的线程 3.tidprintf “%x\n” [tid] 将tid转换为十六进制4.jstack [pid] | grep -A 10 [tid的十六进制] 打印堆栈信息。Linux服务器CPU占用率达到100%且一直居高不下,严重影响业务系统的正常使用。Ps aux | grep pod 然后直接kill掉。1.top 命令定位应用进程 pid。5.根据堆栈信息分析问题。
2023-06-03 22:11:41 742
原创 Linux系统监控篇
在pmlogger 存档中收集数据后,将使用 pmval或 pmchart 工具来基于选择的性能指标查询和处理数据(注意需要使用-a 选项来针对存档数据和并非实时数据)。lsblk -p 命令列出设备的完整路径,UUID 和挂载点,以及分区中文件系统类型。Sar 命令从内核计算器收集指标,并有一个代理,它按预定时间执行以记录系统活动这个命令还可以收集系统状态的瞬时数据。ps -l #查看进程更多的信息,当一个进程的PPID和PID 相同时,PPID为子进程,PID为父进程。
2023-04-28 23:05:45 3428
原创 故障案列-命令行变成 -bash-4.1$或 -bash-4.2$格式
解决方法:从/etc/skel 下面复制3个隐藏文件到用户的家目录(是出事的用户),然后重新登录。原因:用户(除root用户)不小心删除,家目录下面的隐藏的配置文件(用户命令行格式相关)
2023-04-20 10:38:07 213
原创 Linux基本命令600条总结
find /home/user1 -name ‘*.txt’ | xargs cp -av --target-directory=/home/backup/ --parents 从一个目录查找并复制所有以 ‘.txt’ 结尾的文件到另一个目录。mkisofs -J -allow-leading-dots -R -V “Label CD” -iso-level 4 -o ./cd.iso data_cd 创建一个目录的iso镜像文件。
2023-03-02 11:16:11 201
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人