缓存击穿导致 golang 组件死锁的问题分享


分享一个线上遇到的死锁问题,什么, golang 也会有死锁?

思路排查

Dump 堆栈很重要

线上某个环境发现 S3 上传请求卡住,请求不返回,卡了30分钟,长时间没有发现有效日志。一般来讲,死锁问题还是好排查的,因为现场一般都在。类似于 c 程序,遇到死锁问题都会用 pstack 看一把。golang 死锁排查思路也类似(golang 不适合使用 pstack,因为 golang 调度的是协程,pstack 只能看到线程栈),我们其实是需要知道 S3 程序里 goroutine 的栈状态。golang 遇到这个问题我们有两个办法:

  1. 方法一:条件允许的话,gcore 出一个堆栈,这个是最有效的方法,因为是把整个 golang 程序的内存镜像 dump 出来,然后用 dlv 分析;
  2. 方法二:如果你提前开启 net/pprof 库的引用,开启了 debug 接口,那么就可以调用 curl 接口,通过 http 接口获取进程的状态信息;

需要注意到,golang 程序和 c 程序还是有点区别,goroutine 非常多,成白上千个 goroutine 是常态,甚至上万个也不稀奇。所以我们一般无法在终端上直接看完所有的栈,一般都是把所有的 goroutine 栈 dump 到文件,然用 vi 打开慢慢分析。

  • 调试这个 core 文件,意图从堆栈里找到些东西,由于堆栈太多了,所以就使用 gorouties -t -u 这个命令,并且把输出 dump 到文件;
  • curl xxx/debug/pprof/goroutine

关键思路

成千上万个 goroutine ,直接显示到终端是不合适的,我们 dump 到文件 test.txt,然后分析 test.txt 这个文件。去查找发现了一些可疑堆栈,那么什么是可疑堆栈?重点关注加锁等待的堆栈,关键字是 runtime_notifyListWaitsemaphoresync.(*Cond).WaitAcquire 这些阻塞场景才会用到的,如果业务堆栈上出现这个加锁调用,就非常可疑。

划重点

  1. 留意阻塞关键字 runtime_notifyListWaitsemaphoresync.(*Cond).WaitAcquire
  2. 业务堆栈(非 runtime 的一些内部堆栈)
    在这里插入图片描述
    统计分析发现,有 11 个这个堆栈都在这同一个地方,都是在等同一把锁 blockingKeyCountLimit.lock,所以基本确认了阻塞的位置,就是这个地方阻塞到了所有的请求,但是这把锁我们使用 defer 释放的,使用姿势如下:
// do someting
lock.Acquire(key)
defer lock.Release(key)

// 以下为锁内操作;

blockingKeyCountLimit 是我们封装针对 key 操作流控对象。举个例子,如果 limit == 1,key为 “test” 在 g1 上 Acquire 成功,g2 acquire(“test”) 就会等待,这个可以算是我们优化的一个逻辑。如果 limit == 2,那么就允许两个人加锁到,后面的人都等待。

从代码来看,函数退出一定会释放的,但是偏偏现在锁就卡在这个地方,所以就非常奇怪。我们先找哪个 goroutine 占着这把锁不释放,看看能不能搞清楚怎样导致这里抢不到锁的原因。

通过审查业务代码分析,发现可能的源头函数(这个函数是向后端请求的函数):

api.(*Client).getBytesNolc

确认是 getBytesNolc 这个函数执行的操作,那么大概率就是卡在这个地方了。用这个 getBytesNolc 字符串搜索堆栈,找下是哪个堆栈 ?搜索到这个堆栈 goroutine 19458

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 我们可以使用Golang来构建一个分布式缓存系统。一般来说,分布式缓存系统的实现包括:缓存服务器、缓存客户端、分布式缓存服务器、分布式缓存客户端、分布式缓存存储引擎和缓存管理服务器。使用Golang可以构建一个可靠、可扩展、高性能的分布式缓存系统。 ### 回答2: 分布式缓存系统是一个将数据存储在多台机器上的缓存系统,可以提高数据访问的性能和并发能力。在golang中,我们可以使用一些库和技术来实现一个分布式缓存系统。 首先,我们需要选择一个合适的分布式存储技术来存储缓存数据,比如使用Redis或Memcached。这些技术可以让我们将缓存数据分布在多个节点上,并提供高性能的读写操作。 其次,我们需要设计一个对外提供接口的服务来操作缓存。可以使用golang的HTTP服务器来实现这个服务。通过定义一些RESTful API,如GET、PUT、DELETE等,客户端可以向服务器发送请求来获取、设置或删除缓存数据。 在服务器端的代码中,我们需要处理接收到的请求,并将其映射到相应的缓存操作。当有GET请求时,我们需要先检查缓存中是否存在所需的数据,如果存在则直接返回,否则再从存储系统获取数据并放入缓存中。当有PUT请求时,需要将数据存储到缓存和存储系统中。当有DELETE请求时,需要从缓存和存储系统中删除相应的数据。 为了实现缓存的分布式特性,我们可以使用一致性哈希算法或一致性哈希环来将缓存数据分布到不同的节点上。这样可以确保当节点发生故障或增加时,仅会影响到部分数据,而不会影响全部缓存数据。 最后,我们需要定期清理缓存中的过期数据,以防止缓存数据占用过多的存储空间。可以使用定时任务或定时器来实现这个功能。 以上是一个简单的分布式缓存系统的设计和实现过程。当然,实际的分布式缓存系统可能还涉及到一些其他的问题,如并发控制、持久化存储等,但是以上提到的内容可以帮助我们开始构建一个基本的分布式缓存系统。 ### 回答3: 分布式缓存系统是用来提高系统的读取性能和减轻数据库压力的重要组件,能够将数据存储在多个节点上,提供快速的访问速度和高可用性。 在使用golang编写一个分布式缓存系统时,可以先考虑以下几个关键点: 1. 数据分片:将数据按照一定的规则分散存储到不同的节点上,可以使用一致性哈希算法或分片算法来实现。 2. 节点管理:需要设计节点的动态增删、负载均衡以及容错机制。可以使用集群管理工具如etcd或者zookeeper来实现。 3. 数据存储:使用内存数据库如Redis或Memcached来存储缓存数据,并保证数据的一致性和高可用性。可以选择golang中的redis或memcache客户端库进行数据读写。 4. 缓存更新和失效:提供缓存的自动更新机制,当数据发生变化时,需要及时更新缓存数据,同时设置合理的缓存失效策略,避免使用过期的数据。 5. 高可用性:保证缓存系统的高可用性,当节点出现故障时,能够自动切换到其他可用的节点上,并进行数据恢复。 6. 监控和日志:实现对缓存系统的监控和日志记录,可以使用Prometheus和Grafana等工具进行监控和性能分析。 在实现分布式缓存系统时,需要综合考虑不同的因素,并做好合理的设计和优化。同时,需要进行大规模测试和性能调优,确保系统的稳定和高效运行。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值