一个cpu占用率高的小问题

      早上醒来便被系统报警短信施加了不小的压力,系统夜间多次报警,cpu使用率过高(超过90%),昨天晚上确实是上线了一个计算类的需求,不过算法相对简单(简单来说就是取两个字符串的公共子串,然后做一些处理),主观上认为不会因为这导致cpu爆掉,但是问题就是随着这个需求出现的,肯定拖不了干系,哎,bug排查往往就是这样,感觉某某地方不应该有问题,但是除了他又别无怀疑对象。

火急火燎的赶到公司,先申请了几台服务器扩容,缓解下压力,(leader也建议先下掉这个接口,但是我观察了这个接口的具体指标后,预估先扩下容,能撑住,撑不住再下,再则,下掉后,现象也会随之消失,更不利于排查问题)

扩容后,cpu和内存,都降到了可以接受的程度。

开始排查

1:单台服务器qps很低,个位数,可以放弃了。

2:想通过jstack看下,但是线上环境没权限执行这个命令,只能放弃

3:线下模拟,虽然感觉基本没用,毕竟上线之前,线下已经测试了,但是死马当作活马医,人总是会抱着万一的想法的,不过现实并不理想,由于没有跳出之前测试的思路,再次测试并没有突破。

4:真正没办法了,就该冷静下来了,既然公司不许线上环境使用jstack,jmap(确实也不应该允许使用,至少权限不能完全放开),那么肯定又其他路子可以通向罗马,在公司群里吼了一嗓子后,发现果然是我太low,公司的监控系统是可以看到堆栈信息的(随便推荐下公司开源的监控系统cat,github地址:https://github.com/dianping/cat

截图如下:


根据堆栈信息,找到相关代码,截图如下:



代码相对来说简单,但从代码来看,除了list的遍历写的不太友好(具体就不细说了,都应该能看出来)之外,并看不出什么。算了,先把能看到的解决了,

但是上线之后,问题依旧的话岂不是很尴尬,先测试下两种方式的效果再说吧,简单测试,发现list长度上万之后,效率才有差异,果断放弃这条线了(并不是不改,而是接着排查原因),这样基本就没啥可排查了,只有list很大了可查了,但是主观上是不信的,再大能有多大呢。按照之前的测试代码debug之后,list长度并无问题,测试和线上不一样的,也就只有入参了,对了,入参,去线上log中找了cpu报警时的入参,有亮点,比测试环境长很多,好歹有可测的地方了,debug之后,果然,这个入参,查处的list的size竟然有将近7千,其中绝大部分都是空,后面就好定位了,算法逻辑有问题,在入参较长的情况下,很容易暴漏出来(这个需求的场景中,一把都很短,自测也确实不够全面),修复之后,cpu降至个位数,搞定。

回头来看,问题本身很简单,但是前后排查缺花了近2个小时,让自己长个急性,留个爪

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: SQL Server CPU占用率可能是由于以下原因导致的: 1. 查询语句效率低下:如果查询语句没有优化,可能会导致CPU占用率。可以通过优化查询语句来减少CPU占用率。 2. 索引问题:如果表没有正确的索引,可能会导致查询效率低下,从而导致CPU占用率。可以通过创建正确的索引来解决这个问题。 3. 内存不足:如果SQL Server使用的内存不足,可能会导致CPU占用率。可以通过增加内存来解决这个问题。 4. 并发连接数过高:如果SQL Server同时处理的连接数过多,可能会导致CPU占用率。可以通过限制并发连接数来解决这个问题。 5. SQL Server版本过低:如果SQL Server版本过低,可能会导致CPU占用率。可以升级到最新版本来解决这个问题。 以上是一些可能导致SQL Server CPU占用率的原因,需要根据具体情况进行排查和解决。 ### 回答2: SQL Server CPU占用率可能由许多原因引起,以下是一些可能的原因和解决方法: 1.查询导致CPU资源瓶颈。在查询中使用了较多的函数或在大型表上使用了JOIN操作,并且查询过程中无法利用索引,都可能导致CPU占用率过高。解决可以优化查询或对表或相关的视图索引建立相关索引,或采用分区方式等来规避一些性能问题。 2.其他应用程序占用导致SQL Server CPU资源不足。系统资源是有限的,如果有其他应用程序同时占用CPU资源,就会导致SQL Server CPU占用率。解决可以在服务器上安装该应用程序的其他实例,并对SQL Server分配更多的硬件资源。 3.SQL Server配置不当。如果SQL Server安装或配置存在问题,比如不存在足够的物理内存,或者内存不足以满足SQL Server的运行要求,这些都会导致CPU占用率。解决可以升级服务器,重视资料维护及其优化,调整配置。 4.SQL Server脚本问题。如果有过于复杂的SQL脚本,则需要运行一定时间,可能会占用很多CPU资源。解决办法可以使用合适的存储过程等,降低脚本执行时间。 5.SQL Server日志过多。由于SQL Server写入大量数据到日志文件中,可能也会导致CPU占用率使用压缩、切换和削减日志文件轮换等方式,可以减少日志过多的问题,达到更好的性能。 以上是SQL Server占用率的一些原因和解决方法,如果遇到问题,可以根据具体情况采取相应的解决方案。 ### 回答3: SQL Server 的 CPU 占用率,可能是由于以下原因引起的: 1. 查询负载过重:当大量的查询同时请求 SQL Server 时,它的 CPU 占用率就会升,因为 SQL Server 必须尽快处理这些请求。如果您的应用程序中有许多查询,建议优化它们或者使用索引来加快查询速度。 2. 锁竞争:当多个用户尝试同时访问同一个资源(例如表或行)时,可能会导致锁竞争,从而增加 CPU 占用率。在这种情况下,可以尝试优化查询,或者考虑重新设计应用程序以避免锁竞争。 3. 资源争抢:如果您的 SQL Server 实例与其他应用程序或服务共享 CPU、内存或其他资源,那么当这些应用程序或服务需要更多资源时,它们会减少 SQL Server 实例可用的资源,从而增加 CPU 占用率。在这种情况下,可以考虑增加硬件资源,或者将 SQL Server 实例迁移到专用服务器上。 4. 内存不足:当 SQL Server 实例没有足够的内存可用时,它会不断进行磁盘读取和写入,从而加重 CPU 的负担。在这种情况下,可以尝试增加可用内存,或者设置最小内存限制,以防止其他进程占用过多内存。 5. 过度使用临时表:如果查询中使用了大量临时表,那么会增加 CPU 占用率。尝试减少使用临时表或者优化查询可以减少 CPU 占用率。 解决 SQL Server 的 CPU 占用率问题,可以使用如下方法: 1. 监视性能计数器和 sys.dm_os_performance_counters 视图,以确定哪些进程或操作正在消耗 CPU 时间,以及需要采取哪些措施来减少此类操作的负载。 2. 使用 SQL Server Profiler 或 Extended Events 跟踪查询,以查找可能导致 CPU 占用率的查询。 3. 优化查询,使用索引等方法来提查询性能,减少 CPU 占用率。 4. 增加可用内存,以减少磁盘读写操作的频率。 5. 将 SQL Server 实例迁移到专用服务器上,避免和其他应用程序或服务共享 CPU、内存等资源。 总之,Sql Server 的 CPU 占用率,需要综合考虑各种因素,从查询负载、锁竞争、资源争抢、内存不足、临时表使用等方面综合优化才能有效解决。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值