了解更多Greenplum技术干货,欢迎访问Greenplum中文社区网站
大家好,我是Pivotal Greenplum团队的一名售后工程师。平时会帮助我们的全球的商业用户解决数据库的相关的问题。在实际工作中,我们经常会被数据库管理员问及:“我的SQL跑了很长时间没有结果,我该怎么样排查?” “数据库某一条SQL卡住了怎么办?” 今天,我们将就这个内容做一些分析和总结。
一般来说,SQL卡住或者运行时间长这类常见问题的原因如下:
- SQL因为死锁原因,并没有执行
- SQL因为Resource Queue或者Resource Group没有资源而等待
- SQL因为在某一个segment或者某个机器的问题而卡住
针对问题1 和 问题2,在Greenplum中,我们可以通过查询pg_locks表和gp_toolkit/GPCC中资源队列/组的状态来排查。
而问题3,往往是非常棘手又不得不解决的.下面我们将详细介绍在排除了死锁和资源组/队列问题后,SQL仍然长时间没有返回结果的排查方法。
首先,我们需要通过如下语句确定SQL的 Session ID也叫Connection ID。比如我们数据库中有一个truncate 语句长时间没有返回结果,我们可以通过下面语句确定SessionID
gpadmin=# SELECT * from pg_stat_activity where upper(current_query) like '%TRUNCATE%'; datid | datname | procpid | sess_id | usesysid | usename | current_query | waiting | query_start | backend_start | client_addr | client_port | application_name |