KILL MYSQL SQL出现线程无法终止，出现freeing items现象问题

最新推荐文章于 2024-09-25 10:38:39 发布

jerry-89

最新推荐文章于 2024-09-25 10:38:39 发布

阅读量2.1k

点赞数

本文链接：https://blog.csdn.net/eagle89/article/details/81486017

版权

KILL查询SQL出现线程无法终止，出现freeing items现象问题；

实例：今天公司DB 有大量的线程是freeing items 状态。DB服务器上跑应用，还有一些大的不固定的数据抓取查询(不固定，经常变动)，结果使用了Query cache ，导致Query Cache 池的抖动，频繁有cache失效，产生了freeing items 状态,下面是官方对freeing items的解释：

The thread has executed acommand. Some freeing of items done during this state involves the query cache.This state is usually followed by cleaning up.

线程已经执行了命令。在这个状态中涉及的查询缓存可以得到一些释放。这个状态通常后面跟随cleaning up状态。

最后把query_cache_limit为1M，很少有freeing items 状态。uery_cache_limit和query_cache_size的设置要紧结合具体的业务现状来调整。

原SQL语句；
SELECT `资源类型`, SUM(`资源总数`) AS LONG_COL_0, SUM(`资源总数_统一单位后`) AS LONG_COL_1 FROM (select DISTINCT
CAST(order_id as CHAR) as '订单id'
, CAST(customer_id as CHAR) as '客户id'
, contract_money as '合同实际总金额'
, CAST(creator_id as CHAR) as '合同维护人id'
, creator_name as '维护人名称'
, creator_org_id as '维护人所属组织id'
, creator_org_name as '维护人所属组织名称'
, sales_level as '销售级别（s、ss、ka）'
, CAST(rps_user_id as CHAR) as '招服id'
, rps_user_name as '招服名称'
, CAST(rps_org_id as CHAR) as '招服团队id'
, rps_org_name as '招服团队名称'
, CAST(rps_branch_id as CHAR) as '招服所属分公司id'
, rps_branch_name as '招服所属分公司名称'
, customer_name as '客户名称'
, customer_dq as '客户地区'
, customer_branch as '客户所属分公司'
, customer_area as '客户所属公司大区'
, industry as '行业'
, company_scale as '公司规模'
, company_kind as '公司性质'
, date(resource_start_date) as '资源服务开始日期'
, date(resource_timeout_date) as '资源服务结束日期'
, (case when substr(regexp_replace(resource_timeout_date,'-',''),1,8)-d_date>0 then '正在执行中的合同'
else '已到期的合同' end) as '是否为在执行的合同'
, (case when resource_kind=2 then 'LPT精英简历'
when resource_kind=3 then 'LPT意向沟通'
when resource_kind=6 then 'LPT邀请应聘'
when resource_kind=8 then 'LPT白领简历'
when resource_kind=9 then 'LPT急聘点数'
when resource_kind=10 then 'LPT猎币'
else null end)as '资源类型'
, resource_total_cnt as '资源总数'
, (case when resource_kind=2 then resource_total_cnt*1
when resource_kind=3 then resource_total_cnt*2
when resource_kind=6 then resource_total_cnt*5
when resource_kind=8 and business_kind=!6 then resource_total_cnt/5
    when resource_kind=9 then resource_total_cnt*5
    when resource_kind=10 then resource_total_cnt/50
else 0 end) as '资源总数_统一单位后'
from   detail_bi
where consume_date>='2017-01-01'
and resource_start_date>='2017-01-01'
and lpt_service_effect_date>='2017-01-01'
and contract_effect_date>='2017-01-01'
and contract_status=3 -- 已生效
and order_status=2 -- 已开通
and business_kind in (0,1,6) -- 合同签约、在线购买
and resource_kind in (2,3,6,8,9,10) -- LPT精英简历、LPT意向沟通、LPT邀请应聘、LPT白领简历、LPT急聘点数、LPT猎币
and consume_kind in (2,6) -- 客户消费、协商扣除
) SUB_QRY WHERE ( `资源服务开始日期` BETWEEN '2017-06-01' AND '2018-08-05' ) AND ( `是否为在执行的合同` = '正在执行中的合同' ) GROUP BY `资源类型` ORDER BY `资源类型` DESC LIMIT 5000000

一、工作原理

查询缓存的工作原理，基本上可以用二句话概括：

1.缓存SELECT操作或预处理查询（注释：5.1.17开始支持）的结果集和SQL语句；

2.新的SELECT语句或预处理查询语句，先去查询缓存，判断是否存在可用的记录集，判断标准：与缓存的SQL语句，是否完全一样，区分大小写；

二、查询缓存对什么样的查询语句，无法缓存其记录集，大致有以下几类：

a.查询语句中加了SQL_NO_CACHE参数；

b.查询语句中含有获得值的函数，包含自定义函数，如：CURDATE()、GET_LOCK()、RAND()、CONVERT_TZ等；

c.对系统数据库的查询：mysql、information_schema

d.查询语句中使用SESSION级别变量或存储过程中的局部变量；

e.查询语句中使用了LOCK IN SHARE MODE、FOR UPDATE的语句

f.查询语句中类似SELECT…INTO 导出数据的语句；

g.事务隔离级别为：Serializable情况下，所有查询语句都不能缓存；

h.对临时表的查询操作；

i.存在警告信息的查询语句；

j.不涉及任何表或视图的查询语句；

k.某用户只有列级别权限的查询语句；

三、查询缓存的优缺点：

不需要对SQL语句做任何解析和执行，当然语法解析必须通过在先，直接从Query Cache中获得查询结果。

查询缓存的判断规则，不够智能，也即提高了查询缓存的使用门槛，降低其效率；

Query Cache的起用，会增加检查和清理QueryCache中记录集的开销，而且存在SQL语句缓存的表，每一张表都只有一个对应的全局锁。

四、配置

是否启用mysql查询缓存，可以通过2个参数：query_cache_type和query_cache_size，其中任何一个参数设置为0都意味着关闭查询缓存功能，但是正确的设置推荐query_cache_type=0。

a. query_cache_type

值域为：0 -–不启用查询缓存；

值域为：1 -–启用查询缓存，只要符合查询缓存的要求，客户端的查询语句和记录集斗可以缓存起来，共其他客户端使用；

值域为：2 -–启用查询缓存，只要查询语句中添加了参数：SQL_CACHE，且符合查询缓存的要求，客户端的查询语句和记录集，则可以缓存起来，共其他客户端使用；

b. query_cache_size

允许设置query_cache_size的值最小为40K，对于最大值则可以几乎认为无限制，实际生产环境的应用经验告诉我们，该值并不是越大，查询缓存的命中率就越高，也不是对服务器负载下降贡献大，反而可能抵消其带来的好处，甚至增加服务器的负载，至于该如何设置，下面的章节讲述，推荐设置为：64M；

c. query_cache_limit

限制查询缓存区最大能缓存的查询记录集，可以避免一个大的查询记录集占去大量的内存区域，而且往往小查询记录集是最有效的缓存记录集，默认设置为1M，建议修改为16k~1024k之间的值域，不过最重要的是根据自己应用的实际情况进行分析、预估来设置；

d. query_cache_min_res_unit

设置查询缓存分配内存的最小单位，要适当地设置此参数，可以做到为减少内存块的申请和分配次数，但是设置过大可能导致内存碎片数值上升。默认值为4K，建议设置为1k~16K。

内存块分配的最小单元非常重要，设置过大可能增加内存碎片的概率发生，太小又可能增加内存分配的消耗，为此在系统平稳运行一个阶段性后，可参考公式的计算值：

查询缓存最小内存块 =(query_cache_size – Qcache_free_memory) / Qcache_queries_in_cache（Qcache_free_memory:The amount of free memory for the query cache; Qcache_queries_in_cache:使用了query cache查询的数量）

e. query_cache_wlock_invalidate

该参数主要涉及MyISAM引擎，若一个客户端对某表加了写锁，其他客户端发起的查询请求，且查询语句有对应的查询缓存记录，是否允许直接读取查询缓存的记录集信息，还是等待写锁的释放。默认设置为0，也即允许；

五、维护

1.查询缓存区的碎片整理

查询缓存使用一段时间之后，一般都会出现内存碎片，为此需要监控相关状态值，并且定期进行内存碎片的整理，碎片整理的操作语句：FLUSH QUERY CACHE；

2.清空查询缓存的数据

那些操作操作可能触发查询缓存，把所有缓存的信息清空，以避免触发或需要的时候，知道如何做，二类可触发查询缓存数据全部清空的命令：

(1). RESET QUERY CACHE；

(2). FLUSH TABLES；

六、性能监控

1.碎片率

查询缓存内存碎片率=Qcache_free_blocks/ Qcache_total_blocks * 100%

2.命中率

查询缓存命中率=Qcache_hits/(Qcache_hits+ Qcache_inserts) * 100%

2.内存使用率

查询缓存内存使用率=(query_cache_size– Qcache_free_memory) / query_cache_size * 100%

3.Qcache_lowmem_prunes

该参数值对于检测查询缓存区的内存大小设置是否，有非常关键性的作用，其代表的意义为：查询缓存去因内存不足而不得不从查询缓存区删除的查询缓存信息，删除算法为LRU。

4.query_cache_size

我们如何判断query_cache_size是否设置过小，依然也只有先预设置一个值，推荐为：32M~128M之间的区域，待系统平稳运行一个时间段（至少1周），并且观察这周内的相关状态值：

(1). Qcache_lowmem_prunes；

(2). 命中率；

(3). 内存使用率；

若整个平稳运行期监控获得的信息，为命中率高于80%，内存使用率超过80%，并且Qcache_lowmem_prunes的值不停地增加，而且增加的数值还较大，则说明我们为查询缓冲区分配的内存过小，可以适当地增加查询缓存区的内存大小；

若是整个平稳运行期监控获得的信息，为命中率低于40%，Qcache_lowmem_prunes的值也保持一个平稳状态，则说明我们的查询缓冲区的内存设置过大，或者说业务场景重复执行一样查询语句的概率低，同时若还监测到一定量的freeing items，那么必须考虑把查询缓存的内存条小，甚至关闭查询缓存功能；

七、业务场景

通过上述的知识梳理和分析，我们至少知道查询缓存的以下几点：

1.查询缓存能够加速已经存在缓存的查询语句的速度，可以不用重新解析和执行而获得正确得记录集；

2.查询缓存中涉及的表，每一个表对象都有一个属于自己的全局性质的锁；

3.表若是做DDL、FLUSH TABLES 等类似操作，触发相关表的查询缓存信息清空；

4.表对象的DML操作，必须优先判断是否需要清理相关查询缓存的记录信息，将不可避免地出现锁等待事件；

5.查询缓存的内存分配问题，不可避免地产生一些内存碎片；

6.查询缓存对是否是一样的查询语句，要求非常苛刻，而且还不智能；

我们再重新回到本节的重点上，查询缓存适合什么样的业务场景呢？只要是清楚了查询缓存的上述优缺点，就不难罗列出来，业务场景要求：

7.整个系统以读为主的业务，比如门户型、新闻类、报表型、论坛等网站；

8.查询语句操作的表对象，非频繁地进行DML操作，可以使用query_cache_type=2模式，然后SQL语句加SQL_CACHE参数指定。