线上问题
文章平均质量分 93
简放视野
Microservices, Cloud Native, Service Mesh. Java, Go.
️书写,是为了更清晰地表达,更深度地思考,更深刻地理解。
乐于分享,一直在学习实践的旅途中。
一位乐观开朗的it挨踢手艺人。
展开
-
Arthas在线诊断Docker容器应用业务问题
Java 应用诊断利器Arthas 是一款线上监控诊断产品,通过全局视角实时查看应用 load、内存、gc、线程的状态信息,并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法调用的出入参、异常、监测方法执行耗时、类加载信息等,大大提升线上问题排查效率。原创 2023-01-13 15:52:04 · 1281 阅读 · 1 评论 -
[FAQ] Jedis使用过程中踩过的那些坑
4. 一个大坑:若实例化 JedisShardInfo 时不设置节点名称(name属性),那么当Redis节点列表的顺序发生变化时,会发生“键 rehash 现象” 使用BTrace追踪redis.clients.util.Sharded的实时状态,验证“Jedis分片机制的一致性哈希算法”实现;发现一个致命坑:若JedisShardInfo不设置节点名称(name属性),那么当R...原创 2015-02-06 21:13:50 · 2642 阅读 · 0 评论 -
【线上问题】Redis客户端连接数一直降不下来的问题分析解决
前段时间,上线了新的Redis缓存(Cache)服务,准备替换掉 Memcached。为什么要将 Memcached 替换掉?原因是 业务数据是压缩后的列表型数据,缓存中保存最新的3000条数据。对于新数据追加操作,需要拆解成[get + unzip + append + zip + set]这5步操作。若列表长度在O(1k)级别的,其耗时至少在50ms+。而在并发环境下,这样...原创 2015-02-07 18:23:06 · 2139 阅读 · 2 评论 -
【线上问题】线上服务器内存使用量已达到90%报警-内存泄漏
2016-05-06中午11:56,收到“[sentry2]2016-05-06 11:56:09 xxxxxxhost xxx.xxx.xxx.xxx 内存使用已达到90.18%”报警。首先在脑海浮现的,应该哪里出现内存泄漏了。一、确认问题马上到 Sentry 监控系统查看了该服务的“服务器监控”指标,发现其中2台机器的内存使用量都超过了90%,另外2台尽然没有监控数据(以前是...原创 2016-05-09 00:57:29 · 6292 阅读 · 3 评论 -
[线上问题] “服务端长连接与客户端短连接引起Nginx产生大量“TIME_WAIT“状态的线程”的问题分析解决...
近期,线上Nginx服务器的TPS未超过100,但其Writing、Active连接数有时却超过了300。因为服务对响应时间要求较高,同时每个调用方使用的IP地址有限(即总的不同的连接地址有限),所以使用HTTPs长连接技术。(HTTP长连接与短连接)问题现象:使用"sudo netstat -antp | grep 80"发现,存在大量的"TIME_WAIT" socket等待中断...原创 2014-10-25 16:33:39 · 1185 阅读 · 1 评论 -
[线上问题] Nginx与Tomcat、Client之间请求的长连接配置不一致问题分析解决
前些天,线上出现“服务端长连接与客户端短连接引起Nginx产生大量"TIME_WAIT"状态的线程”的问题分析解决”,这个是由于“服务端使用HTTPs长连接,而客户端使用短连接”引起。这几天,发现Nginx与Tomcat之间也存在同样的问题,原因是两边的相关配置参数不一致引起的。(这是心细活!) 先说说服务为什么使用HTTPs长连接技术?有如下几个原因:对响应时间要求较高;...原创 2014-11-06 20:36:57 · 588 阅读 · 0 评论