使用python的大规模linux服务器监控系统开发——信息收集方式及ssh慢和SSHException('No existing session',)问题

5 篇文章 0 订阅
4 篇文章 0 订阅

信息收集方式

使用python的paramiko模块多线程ssh到每台服务器上执行shell命令,将返回结果处理入库。

通过定时任务执行python脚本,采集间隔2分钟,crontab最低一分钟,对于主机指标监控足够了。目前优化的结果是750台主机40几秒完成,如果规模再大的话可以考虑将主机列表分成两部分分别放在两台服务器上收集,不过当然应该先优化并发执行能力。

ssh慢的问题

实行ssh命令后等半天才让输密码,网上查了是因为sshd使用了使用DNS解析,解决方法有两个:
1. 把ssh目标主机的hostname和ip地址添加到hosts文件中
2. 修改/etc/ssh/sshd_config文件,将#UseDNS yes改为UseDNS no然后重启sshd服务。

共750台服务器,其中有206个ssd_config默认值是#UseDNS yes\n的。

多线程ssh收集信息入库,每个线程间隔0.07秒,平均每次耗时1分5秒

(‘start…’, ‘2018-04-26 13:54:01’)
(‘end…’, ‘2018-04-26 13:55:05’)
(‘start…’, ‘2018-04-26 13:56:02’)
(‘end…’, ‘2018-04-26 13:57:06’)
(‘start…’, ‘2018-04-26 13:58:01’)
(‘end…’, ‘2018-04-26 13:59:07’)
(‘start…’, ‘2018-04-26 14:00:01’)
(‘end…’, ‘2018-04-26 14:01:06’)
(‘start…’, ‘2018-04-26 14:02:01’)
(‘end…’, ‘2018-04-26 14:03:06’)


修改为UseDNS no以后,缩短为55秒,节省了10秒

(‘start…’, ‘2018-04-26 14:04:01’)
(‘end…’, ‘2018-04-26 14:04:55’)
(‘start…’, ‘2018-04-26 14:06:01’)
(‘end…’, ‘2018-04-26 14:06:56’)
(‘start…’, ‘2018-04-26 14:08:01’)
(‘end…’, ‘2018-04-26 14:08:56’)
(‘start…’, ‘2018-04-26 14:10:01’)
(‘end…’, ‘2018-04-26 14:10:56’)


修改每个线程间隔时间,每减少0.01秒,整体快==6-7==秒

(‘start…’, ‘2018-04-26 14:12:01’)
(‘end…’, ‘2018-04-26 14:12:56’)
(‘start…’, ‘2018-04-26 14:14:01’)
(‘end…’, ‘2018-04-26 14:14:49’)
(‘start…’, ‘2018-04-26 14:16:02’)
(‘end…’, ‘2018-04-26 14:16:49’)
(‘start…’, ‘2018-04-26 14:18:02’)
(‘end…’, ‘2018-04-26 14:18:43’)
(‘start…’, ‘2018-04-26 14:20:01’)
(‘end…’, ‘2018-04-26 14:20:43’)

SSHException(‘No existing session’,)问题

一直减到0.04秒时开始报错,部分主机ssh失败

SSHException(‘No existing session’,)

目前理解是线程不够用了,所有线程都用完了,第一个线程却还没执行完,不知道对不对,但是调整线程间隔时间就可以解决。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值