超算节点内存泄漏原因和处理

1 内存泄漏的原因:应用程序在占用内存后,退出时没有及时的放出内存,导致没有放出的这块内存不能被其他程序使用,从而出现内存变小,泄漏问题;终究原因其实就是程序没有写好。

2 内存泄漏的判断:可以通过shell脚本检测出节点的内存大小,并比对节点已安装的内存大小,如果小于节点原始内存大小,则表示内存出现泄漏情况;

处理步骤:

1内存泄漏严重的话,会严重影响应用或者计算作业的运行情况,这个时候先关闭内存泄漏节点的作业提交功能:badmin hclose node178(主机名) ,再用bhosts node178看节点的状态;

2手动卸载节点的共享文件系统/home,先用fuser -ck  /home 看有哪些进程在使用文件系统,并把他们杀掉,然后使用umount /home卸载文件系统。也可以批量卸载文件系统:

 先把要批量卸载并重启的节点新建在一个文件里,比如是node.list  ,然后使用,nprsh -f node.list  fuser -ck /home ,  nprsh -f node.list  umount  /home 

内存查看的一些命令:

free -g查看内存大小,以G为单位表示,-m ,-k参数则是以M和K为单位表示

dmidecode -t  17 (这个命令可以查看内存模块插槽,可以看到是哪个模块内存丢失,方便换新的内存到坏的模块)

 

转载于:https://www.cnblogs.com/wangnengwu/p/5684444.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值