![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
服务器
伦无次语
这个作者很懒,什么都没留下…
展开
-
记一次线上文件数打开过多的问题(一)
问题线上服务忽然宕机,导致应用全部异常退出拒绝服务,运维同学反馈线上app无法登录了。查找原因直觉告诉我,又是数据库挂了(之前有过先例),已经做好了最坏的打算,准备去kill process了,打开阿里云后台,结果发现数据库一切正常。然后去看应用服务的监控,结果发现没有任何监控数据,开始以为是monitor也一起挂掉了,后来才知道是因为应用挂掉,导致数据无法采集才产生了CPU、内存等数据全...原创 2018-10-15 03:29:45 · 929 阅读 · 0 评论 -
记一次线上文件数打开过多的问题(二)
分析之前分析对文件数打开过多的原因可能存在如下三个地方:分布式锁异步定时任务异步写日志下面一个一个分析。分布式锁分布式锁是采用redis实现的,加入了自旋的功能(redis做分布式锁终归不是一个很好的方案),但是代码中使用这个锁的地方不止一处,之前都一直没有出问题,所以先放一边。异步写日志由于查看lsof,是sock一直在增长,考虑是网络连接没有正常释放的问题,用到网络连接...原创 2018-10-16 02:07:48 · 682 阅读 · 0 评论 -
简易服务健康检查工具
现在大部分公司都在推进微服务改造,微服务带来的便利性显而易见,服务拆分后每个微服务功能独立,可以独立部署和弹性伸缩,单个服务的可维护性大大增强,但是随之而来的问题也不少,服务的调用链路变长,中间的问题就会增加;服务增加后,服务的管理也是一个大问题。公司的部署方式是N个docker容器部署在同一台测试机器,然后通过Nginx转发请求到对应的服务,但是奇怪的是如果其中某台服务down掉,会造成其他服...原创 2018-10-17 03:27:52 · 931 阅读 · 0 评论