shared pool分析之结构

最新推荐文章于 2024-07-23 16:20:46 发布

weixin_33711641

最新推荐文章于 2024-07-23 16:20:46 发布

阅读量97

点赞数

文章标签：数据结构与算法数据库 java

原文链接：http://blog.51cto.com/ace105/730610

版权

shared pool分析

解析SQL语句、生成执行计划、

解析SQL ------------|

| |---需要考虑访问对象是否存在，权限时候具有等因素

生成执行计划--------|

执行SQL语

解析的过程是一个耗费资源的过程，随着用户的并发数量的增加。数据库的性能也会降低的很快。

在mysql中没有绑定变量的概念，在oracle中我们可以使用绑定变量来大幅减少我们的SQL解析次数。

ORCLE对解析的执行

1、ORACLE将SQL语句分成为两个部分

静态部分+动态部分

2、静态部分

SQL 语句的关键词

所涉及的表名称、列名称、等

3、动态部分

字面值（表里面的表数据）

例如 where name=‘ace’

那么where name是静态部分、ace是动态部分

静态部分是有限的、动态部分是无限的

在实际中，不同的SQL语句的静态部分的重复率非常的高、动态部分导致了SQL语句的千变万化

实际上，静态部分对SQL语句的解析的影响可以忽略不计，主要是动态部分

ORCLE将解析过的SQL语句缓存在shared pool中，碰到相同的SQL语句再次执行的时候，ORACLE直接使用已经解析过的执行计划。

Shared pool中缓存的内容包括

1、SQL语句

2、执行计划

3、PL/SQL代码

4、PL/SQL机器码等

通过使用绑定变量，用来提高SQL语句的缓存命中率

declare

v1 varchar2(10);

i1 int(10);

begin

i1:=1;

select name into v1 from dba_team where id=i1;

end;

在上面的SQL语句中，使用了绑定变量i1，在解析的时候，使用的绑定变量。执行的时候，将字面值传入语句中。因此这样SQL语句的命中率将会提高。

使用绑定变量是一个很好的思路。

在SQL语句中，更多的使用绑定变量、特别是大型的复杂SQL查询

Shared pool细分

1、库缓存

最近执行的SQL语句、存储过程、函数、解析树、执行计划

最活跃部分

2、数据字典缓存

SQL执行过程中涉及的数据字典

Shared Pool的内存结构（物理结构）

Shared pool由许多的内存块组成，这些内存块称为chunk

1、chunk是shared pool中内存分配的最小单元（类似于extent）

2、一个chunk在内存中是连续的

Chunk的分类

1、free：chunk中没有有效的对象，可以不受限制的分配

如果用于存放和SQL相关的数据，那么chunk就属于 library cache，如果用于存放数据字典，那么这个chunk就属于 dictionary cache

2、recr：recreatable，chunk里面包含的对象可以被临时性的移走，如果需要，可以重建，例如共享SQL语句.上面例子中的i1解析完后就存放在这里。

3、freeabl：session用过这个trunk，里面存放的对象数据是session在处理过程中产生的，没有办法重建，这点不同于recr。因此这个chunk不能被临时性的移走。但是在合适的时间段（一般在seesion结束）可以被释放。

4、perm：permanent，chunk中包含永久性的对象，但是大型的permanent类型的chunk中可能包含可用空间，需要的时候，这些空间可以被释放。例如v$表的中参数。

查看当前数据库中正在使用的chunk，稍后我会抓取trace文件给大家展示下。

SQL> select count(*),KSMCHCLS from x$ksmsp group by KSMCHCLS;

COUNT(*) KSMCHCLS

---------- --------

14938 freeabl

30131 recr

54 R-freea

23 perm

27 R-free

2777 free

查看当前内存地址在使用哪个chunk

SQL> select ADDR,KSMCHCLS from x$ksmsp where rownum <10;

ADDR KSMCHCLS

-------- --------

B6E35EAC freeabl

B6E35E74 freeabl

B6E35E3C freeabl

B6E35E04 recr

B6E35DCC recr

B6E35D94 recr

B6E35D5C freeabl

B6E35D24 freeabl

B6E35CEC freeabl

Shared pool中chunk的分配

1、shared pool中的chunk的大小是不一样的，但是肯定是连续的

2、因为chunk是分配的最小单元，因此session需要给对象分配空间的时候，会以chunk为单位进行申请

3、可用的chunk（free）会形成一个链表（free list，这个free list我们通常叫他bucket），便于进行分配的时候，可以通过遍历链表寻找到可用的适合的chunk，链表是chunk进行组织和管理的一种方式

4、一个可用的chunk链表是一个bucket，shared pool中会有很多的bucket，不同的bucket中的chunk的大小不同，一般是随着bucket编号的增加，bucket的大小是增长的

5、当需要从shared pool中寻找chunk的时候，首先会定位一个bucket（这个bucket有点特殊，session会优先定位和符合自己大小的bucket），然后向下遍历bucket，寻找最合适的chunk

如果chunk的空间比需要的空间大，那么这个chunk就拆分成两个，一个被分配、一个成为free，重新挂接到这个bucket上。

6、在寻找chunk的过程中，如果一个bucket中没有合适的chunk，接着寻找另外一个非空的bucket（在每一个bucket上寻找chunk都是从最小chunk开始），如果所有的bucket中都没有合适的chunk，那么就从rec类型的链表中释放一部分的空间。记住只有recreatetable可以被释放。

如果rec中还找不到那就会出现ORA-4013错误。

7、shared pool中所有类型的chunk都是以链表的方式进行管理的

对于上面第4点，我通过抓取trace内存块分析一下，只做简单分析，之后会回trace文件：

alter session set events 'immediate trace name heapdump level 2';

你的转储文件在 udump 目录下.根据日期和时间来查找,也可以根据进程号码来查找.以后再介绍.

这个文件是当前内存的信息，信息量巨大，下面只摘取我们需要的内容。

之前见到的chunk类型分布

HEAP DUMP heap name="sga heap(1,0)" desc=0x2001a948

extent sz=0xfc4 alt=108 het=32767 rec=9 flg=-126 opc=0

parent=(nil) owner=(nil) nex=(nil) xsz=0x400000

EXTENT 0 addr=0x3cc00000

Chunk 3cc00038 sz= 24 R-freeable "reserved stoppe"

Chunk 3cc00050 sz= 212888 R-free " "

Chunk 3cc33fe8 sz= 24 R-freeable "reserved stoppe"

Chunk 3cc34000 sz= 3975024 perm "perm " alo=3975024

Chunk 3cffe770 sz= 4064 perm "perm " alo=4064

Chunk 3cfff750 sz= 2224 free " "

EXTENT 1 addr=0x3d000000

Chunk 3d000038 sz= 24 R-freeable "reserved stoppe"

Chunk 3d000050 sz= 212888 R-free " "

Chunk 3d033fe8 sz= 24 R-freeable "reserved stoppe"

Chunk 3d034000 sz= 2097168 perm "perm " alo=2097168

Chunk 3d234010 sz= 1883412 perm "perm " alo=1883412

Chunk 3d3ffd24 sz= 732 free " "

第4点中我们说到的free list也就是bucket

Total heap size = 50330976

FREE LISTS: ---------千万别把这个FREE LIST和bucket混淆，这个只是trace文件的标示。方便阅读下面有哪个bucket，bucket才是第4点中讲的free list。

Bucket 0 size=16

Bucket 1 size=20

Bucket 2 size=24

Bucket 3 size=28

Bucket 4 size=32

Bucket 5 size=36

Bucket 6 size=40

Bucket 7 size=44

Bucket 8 size=48

Bucket 9 size=52

Bucket 10 size=56

Bucket 11 size=60

Bucket 12 size=64

Bucket 13 size=68

Chunk 3effffbc sz= 68 free " "-----第5点中提到的chunk的拆分

Bucket 14 size=72

Bucket 15 size=76

Bucket 16 size=80

Bucket 17 size=84

Bucket 18 size=88

Bucket 19 size=92

Bucket 20 size=96

Bucket 21 size=100

Bucket 22 size=104

Bucket 23 size=108

Bucket 24 size=112

Bucket 25 size=116

Bucket 26 size=120

Bucket 27 size=124

Bucket 28 size=128

Bucket 29 size=132

Bucket 30 size=136

Bucket 31 size=140

Bucket 32 size=144

Bucket 33 size=148

Bucket 34 size=152

Bucket 35 size=156

Bucket 36 size=160

Bucket 37 size=164

Bucket 38 size=168

Bucket 39 size=172

Bucket 40 size=176

Bucket 41 size=180

Bucket 42 size=184

Bucket 43 size=188

Bucket 44 size=192

Bucket 45 size=196

Bucket 46 size=200

Bucket 47 size=204

Bucket 48 size=208

Bucket 49 size=212

Bucket 50 size=216

Bucket 51 size=220

Bucket 52 size=224

Bucket 53 size=228

Bucket 54 size=232

Bucket 55 size=236

Bucket 56 size=240

Bucket 57 size=244

Bucket 58 size=248

Bucket 59 size=252

Bucket 60 size=256

Bucket 61 size=260

Bucket 62 size=264

Bucket 63 size=268

Bucket 64 size=272

Bucket 65 size=276

Bucket 66 size=280

Bucket 67 size=284

Bucket 68 size=288

Bucket 69 size=292

Bucket 70 size=296

Bucket 71 size=300

Bucket 72 size=304

Bucket 73 size=308

Bucket 74 size=312

Bucket 75 size=316

Chunk 3dfffec4 sz= 316 free " "

Bucket 76 size=320

Bucket 77 size=324

Bucket 78 size=328

Bucket 79 size=332

Bucket 80 size=336

Bucket 81 size=340

Bucket 82 size=344

Bucket 83 size=348

Bucket 84 size=352

Bucket 85 size=356

Bucket 86 size=360

Bucket 87 size=364

Bucket 88 size=368

经典错误赏析：

ORA-4013

当某个chunk正在被使用时（可能是用户正在使用，也可能是使用了dbms_shared_pool包将对象钉在shared pool里），该chunk是不能被移出内存的。

比如某个SQL语句正在执行，那么该SQL语句所对应的游标对象是不能被移出内存的，该SQL语句所引用的表、索引等对象所占用的chunk也是不能被移出内存的。

当shared pool中无法找到足够大小的所需内存时，报ORA-4031错。

当出现4031错的时候，你查询v$sgastat里可用的shared pool空间时，可能会发现name为“free memory”的可用内存还足够大，但是为何还是会报4031错呢？

事实上，在oracle发出4031错之前，已经释放了不少recreatable类型的chunk了，因此会产生不少可用内存。但是这些可用chunk中，没有一个chunk是能够以连续的物理内存提供所需要的内存空间的，从而才会发出4031的错。

shared pool latch的争用问题

只有rec类型的chunk能够被释放空间，即使释放了空间，这些空间可能都不是连续的，都是一些很小的chunk，这样可能形成这样一种情况，shared pool中是大量的非常小的chunk，

这样在寻找chunk的时候，也很难寻找到合适的chunk，同时因为free chunk数量非常的多，因此在分配chunk的时候，就会占用大量的时间，

因为对bucket进行扫描、管理、分配的时候，需要获得shared pool latch，如果小的chunk太多，在扫描free chunk的时候，shared pool latch会被锁定很长的时间，占用太多的时间，自然会发生latch争用的情况，原因就是因为大量的小的free chunk的情况

注意：如果在shared pool中出现了大量的小的free chunk，就会出现share pool latch争用的情况，

而如果增加shared pool尺寸的话，仅仅是延缓shared pool latch的争用，而到最后，就会因为小的free chunks的数量越来越多，争用也会越来越严重。

而到了9i以后，由于大大增加了可用chunk链表（也就是bucket）的数量，同时，每个bucket所管理的可用chunk的尺寸递增的幅度非常小，于是就可以有效的将可用的chunk都均匀的分布在所有的bucket上。这样的结果就是每个bucket上所挂的free类型的chunk都不多，所以在查找可用chunk而持有shared pool latch的时间也可以缩短很多。

shared pool对于大对象的处理

对于非常大的对象，oracle会为它们单独从保留区域里分配空间，而不是从这个可用chunk链表中来分配空间。

这部分空间的大小尺寸就是由初始化参数shared_pool_reserved_size决定的，缺省为shared_pool_size的5%，

这块保留区域与正常的chunk的管理是完全分开的，小的chunk不会进入这块保留区域，而这块保留区域的可用chunk也不会挂在bucket上。

这块保留区域的使用情况可以从视图v$shared_pool_reserved中看到，通常来说，该视图的request_misses字段显示了需要从保留区域的可用链表上上获得大的chunk而不能获得的次数，该字段应该尽量为0，如果大于零，需要增加此区域大小。

通俗的说这块区域是session全部bucket都找不到以后，被逼急了才来这里找，但是这块空间就想武术里面的七伤拳，每取一次都自伤一次。所以就算加大了这块空间，这只是暂时解决问题，需要从业务逻辑才上可以根本解决问题。

SQL> select REQUEST_MISSES from v$shared_pool_reserved;

REQUEST_MISSES

--------------

Shared Pool的内存结构（逻辑结构）

从一个逻辑层面来看，shared pool由library cache和dictionary cache组成。shared pool中组件之间的关系可以用下图一来表示。

从下面这个图中可以看到，当SQL语句（select object_id,object_name from sharedpool_test）进入library cache时，

oracle会到dictionary cache中去找与sharedpool_test表有关的数据字典信息，比如表名、表的列等，以及用户权限等信息。

如果发现dictionary cache中没有这些信息，则会将system表空间里的数据字典信息调入buffer cache内存，读取内存数据块里的数据字典内容，

然后将这些读取出来的数据字典内容按照行的形式放入dictionary cache里，从而构造出dc_tables之类的对象。

然后，再从dictionary cache中的行数据中取出有关的列信息放入library cache中。

library cache 和dictionary cache概述

library cache最主要的功能就是存放用户提交的SQL语句、SQL语句相关的解析树（解析树也就是对SQL语句中所涉及到的所有对象的展现）、执行计划、用户提交的PL/SQL程序块（包括匿名程序块、存储过程、包、函数等）以及它们转换后能够被oracle执行的代码等。

为了对这些内存结构进行管理，还存放了很多控制结构，包括lock、pin、dependency table（从属表）等。

library cache还存放了很多的数据库对象的信息，包括表、索引等等。有关这些数据库对象的信息都是从dictionary cache中获得的。

如果用户对library cache中的对象信息进行了修改，则这些修改会返回到dictionary cache中。

在library cache中存放的所有的信息单元都叫做对象（object），这些对象可以分成两类：

一类叫存储对象，也就是上面所说的数据库对象。它们是通过显式的SQL语句或PL/SQL程序创建出来的，如果要删除它们，也必须通过显示的SQL命令进行删除。这类对象包括表、视图、索引、包、函数等等；（上图中的×××区域）

另一类叫做过渡对象，也就是上面所说的用户提交的SQL语句或者提交的PL/SQL程序块等。这些过渡对象是在执行SQL语句或PL/SQL程序的过程中产生的，并缓存在内存里。如果实例关闭则删除，或者由于内存不足而被交换出去，从而被删除。（上图中的红色区域）

父子游标

当用户提交SQL语句或PL/SQL程序块到oracle的shared pool以后，在library cache中生成的一个可执行的对象，这个对象就叫做游标（cursor）。

不要把这里的游标与标准SQL（ANSI SQL）的游标混淆起来了，标准SQL的游标是指返回多条记录的SQL形式，需要定义、打开、关闭。

下面所说到的游标如无特别说明，都是指library cache中的可执行的对象。

游标是可以被所有进程共享的，也就是说如果100个进程都执行相同的SQL语句，那么这100个进程都可以同时使用该SQL语句所产生的游标，从而节省了内存。

每个游标都是由library cache中的两个或多个对象所体现的，至少两个对象。

一个对象叫做父游标（parent cursor），包含游标的名称以及其他独立于提交用户的信息。从v$sqlarea视图里看到的都是有关父游标的信息；v$sqlarea中VERSION_COUNT字段是表示父子关系的子游标v$sql(子游标具体信息)是没有这个字段的

另外一个或多个对象叫做子游标（child cursors），如果SQL文本相同，但是可能提交SQL语句的用户不同，或者用户提交的SQL语句所涉及到的对象为同名词等，都有可能生成不同的子游标。

因为这些SQL语句的文本虽然完全一样，但是上下文环境却不一样，因此这样的SQL语句不是一个可执行的对象，必须细化为多个子游标后才能够执行。子游标含有执行计划或者PL/SQL对象的程序代码块等。

子游标可以通过v$sql查看。

父游标里面包含的信息包括SQL文本和优化目标

session打开该游标以后，就会锁定父游标

所有的session都关闭该游标以后，锁定才能够释放

父游标在被锁定的时候，不能被交换出内存

父游标交换出内存、子游标也会被交换出内存

子游标被交换出内存、父游标可以不被交换出内存

因为一个父游标可能会有多个子游标

子游标包换所有的信息：执行计划、绑定变量等

子游标随时可能被交换出内存

Oracle根据父游标的信息可以构建出一个子游标，这个过程叫reload

Hash 算法

Oracle在内部管理中大量的使用到了hash

1、使用hash的目的就是为了快速查找和定位

对数值进行hash运算，产生一个索引号，然后根据索引号将数值放置到相应的hash bucket中去

根据hash运算的法则，会产生多个索引号，每一个索引号对应一个hash bucket（一个数值列）

我们在寻找数值的时候，将搜寻的数值进行hash，产生一个索引号，那么这个数值一定在这个索引号对应的 hash bucket中，于是直接跳转到这个hash bucket中进行遍历。这样我们定位数据的时候，就能够大大的减少遍历的数量。

举例：

1.假设我们的数值列表最多可以有10个元素，也就是有10个hash buckets，每个元素最多可以包含20个数值。

2.则对应的二维数组就是t[10][20]。我们可以定义hash算法为n MOD 10。

3.通过这种算法，可以将所有进入的数据均匀放在10个hash bucket里面，hash bucket编号从0到9。

4.我们把1到100都通过这个hash函数均匀放到这10个hash bucket里，当查找32在哪里时，只要将32 MOD 10等于2，这样就知道可以到2号hash bucket里去找，也就是到t[2][20]里去找，2号hash bucket里有10个数值，逐个比较2号hash bucket里是否存在32就可以了

库缓存中就是使用hash bucket来管理的

1、首先根据shared_pool_size指定的尺寸来自动计算hash bucket的个数

2、每个hash bucket后面都串连着多个句柄（该句柄叫做library cache object handle），这些句柄描述了library cache里的对象的一些属性，包括名称、标记、指向对象所处的内存地址的指针等。可以用下图来描述library cache的整体结构

注意：hash bucket就是一个索引号，通过hash bucket对所有的对象进行了分类，分成多个对象链条

在寻找对象的时候，首先根据hash 函数计算出索引号，一定会进入一个hash bucket中

在hash bucket后面是一些句柄，句柄里面是具体的信息，这些信息没有经过hash计算，通过遍历这些句柄，如果对象在这个bucket上，那么就找到，否则说明对象没有在shared pool中，需要创建一个对象，同时将句柄挂接到这个hash bucket上

在寻找对象的时候，可能发现句柄在，但是对象却被换出了内存，怎么办？很简单，将对象重新加载到内存就可以了

可以使用下面的方式来确定reload的比率：

SQL> select 100*sum(RELOADS)/sum(PINS) RELOAD from v$librarycache;

RELOAD

----------

.973957894

我们可以通过查询v$db_object_cache来显示library cache中有哪些对象被缓存，以及这些对象的大小尺寸。

比如，我们可以用下面的SQL语句来显示每个namespace中，大小尺寸排在前3名的对象：

select *

from (select row_number() over(partition by namespace order by sharable_mem desc) size_rank,

namespace,

sharable_mem,

substr(name, 1, 50) name

from v$db_object_cache

order by sharable_mem desc)

where size_rank <= 3

order by namespace, size_rank

当一条SQL语句进入library cache的时候，

先将SQL文本转化为对应ASCII数值，然后对该这些ASCII数值进行hash函数的运算，

传入函数的是SQL语句的名称（name，对于SQL语句来说其name就是SQL语句的文本）以及命名空间（namespace，对于SQL语句来说是“SQL AREA”，表示共享游标。可以从视图v$librarycache里找到所有的namespace）。

运用hash函数后得到一个值，该值就是hash bucket的号码，从而该SQL语句被分配到该号的hash bucket里去。

实际上，hash bucket就是通过串连起来的对象句柄才体现出来的，它本身是一个逻辑上的概念，是一个逻辑组，而不像对象是一个具体的实体。

oracle根据shared_pool_size所指定的shared pool尺寸自动计算hash buckets的个数，shared pool越大，则可以挂载的对象句柄就越多。

当某个进程需要处理某个对象时，比如处理一条新进入的SQL语句时，它会对该SQL语句应用hash函数算法，以决定其所在的hash bucket的编号，

然后进入该hash bucket进行扫描并比较。有可能会发生该对象的句柄存在，但是句柄所指向的对象已经被交换出内存的情况出现。

这时对应的对象必须被再次装载（reload）。也可能该对象的句柄都不存在，这时进程必须重新构建一个对象句柄挂到hash bucket上，然后再重新装载对象。

SQL语句相关的对象有很多（最直观的就是SQL语句的文本），这些对象都存放在library cache里，它们都通过句柄来访问。

可以把library cache理解为一本书，而SQL语句的对象就是书中的页，而句柄就是目录，通过目录可以快速定位到指定内容的页。

SQL> select distinct NAMESPACE from v$librarycache;

NAMESPACE

---------------

BODY

JAVA DATA

SQL AREA -----共享游标（包含父子）

OBJECT

PIPE

JAVA RESOURCE

TABLE/PROCEDURE

TRIGGER

INDEX

JAVA SOURCE

CLUSTER

11 rows selected.

转载于:https://blog.51cto.com/ace105/730610

weixin_33711641

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
shared pool分析之结构

shared pool分析解析SQL语句、生成执行计划、解析SQL ------------| | |---需要考虑访问对象是否存在，权限时候具有等因素生成执行计划--------| | 执行SQL语解析的过程是一个耗费资源的过程，随着用户的并发数量的增加。数据库的性能也会降低的很快。在mysql中没有...
复制链接

扫一扫