zblock 结构_偷窥Data block 的物理结构

作者:grassbell

1.Data Block物理结构图:

2.一次对block的dump过程:

SQL> create table t9 (a varchar(10));

Table created.

SQL> insert into t9 values(‘a‘);

1 row created.

SQL> commit;

Commit complete.

SQL> set serveroutput on

SQL> exec show_space(‘T9‘);

Free Blocks.............................1

Total Blocks............................8

Total Bytes.............................65536

Unused Blocks...........................6

Unused Bytes............................49152

Last Used Ext FileId....................3

Last Used Ext BlockId...................121

Last Used Block.........................2

PL/SQL procedure successfully completed.

SQL> alter system dump datafile 3 block 122;

System altered.

SQL> select * from v$tablespace;

TS# NAMEINC

---------- ------------------------------ ---

0 SYSTEMYES

1 UNDOTBS1YES

8 USERSYES

18 TEMP1YES

Trace文件:

*** 2004-07-25 15:48:01.000

Start dump data blocks tsn: 8 file#: 3 minblk 122 maxblk 122

buffer tsn: 8 rdba: 0x00c0007a (3/122)

scn: 0x0000.0068d716 seq: 0x01 flg: 0x02 tail: 0xd7160601

frmt: 0x02 chkval: 0x0000 type: 0x06=trans data

Block header dump:0x00c0007a

Object id on Block? Y

seg/obj: 0x806dcsc: 0x00.68d714itc: 2flg: Otyp: 1 - DATA

fsl: 0fnx: 0x0 ver: 0x01

ItlXidUbaFlagLckScn/Fsc

0x010x0004.00b.00000fac0x00801885.008c.56 --U-1fsc 0x0000.0068d716

0x020x0000.000.000000000x00000000.0000.00----0fsc 0x0000.00000000

data_block_dump,data header at 0x552105c

===============

tsiz: 0x1fa0

hsiz: 0x14

pbl: 0x0552105c

bdba: 0x00c0007a

76543210

flag=--------

ntab=1

nrow=1

frre=-1

fsbo=0x14

fseo=0x1f9b

avsp=0x1f83

tosp=0x1f83

0xe:pti[0]nrow=1offs=0

0x12:pri[0]offs=0x1f9b

block_row_dump:

tab 0, row 0, @0x1f9b

tl: 5 fb: --H-FL-- lb: 0x1cc: 1

col0: [ 1]61

end_of_block_dump

End dump data blocks tsn: 8 file#: 3 minblk 122 maxblk 122

3.先介绍数据块中包括的3种头信息:

首先,数据块是在data block buffer cache中完成读和写操作的,所以它提供了20bytes的Cache Header和4bytes的Tail给Cache,用来读取和管理。

第2部分是为Transaction层提供的Header信息。它一共占据了48bytes,包括24bytes的控制信息,和一系列的Interested Transaction Slot (ITS)。

剩下的部分都叫Data Area,用来存储用户数据。Data Area也包括data header,和row data及剩余空间。但是Cluster blocks, table blocks, index block的data header,row data结构是不相同的,这里主要介绍table blocks.

4.结合trace文件中的信息,详细介绍:

1) The Cache Header and Tail:

buffer tsn: 8 rdba: 0x00c0007a (3/122)

scn: 0x0000.0068d716 seq: 0x01 flg: 0x02 tail: 0xd7160601

frmt: 0x02 chkval: 0x0000 type: 0x06=trans data

Database block address:占用4 bytes,表示Tablespace relative database block address(RDBA)。包括tns=8,即Tablespace number (User表空间),file#=3, block_id=122

SCN:占用6bytes,表示最后变化的scn。包括2bytes的高位字节(SCN wrap),和4bytes的低位字节(SCN base)

Sequence:占用1byte,用途不明确,可能是辅助SCN的变化

Flag:占用1byte

Format:占用1byte,应该是用来区分版本。Oracle 8之前值为1,之后为2。

Checksum:占用2byte,跟db_block_checksum参数有关系。

引用oracle document的解释:”DB_BLOCK_CHECKSUM determines whether DBWn and the direct loader will calculate a checksum (a number calculated from all the bytes stored in the block) and store it in the cache header of every data block when writing it to disk. Checksums are verified when a block is read-only if this parameter is true and the last write of the block stored a checksum. In addition, Oracle gives every log block a checksum before writing it to the current log.

If this parameter is set to false, DBWn calculates checksums only for the SYSTEM tablespace, but not for user tablespaces.”

Block type:占用1byte,经常用到的有,1=undo segment header block; 2=undo data block; 5= data segment header block; 6=data block

Unused:保留的字节,占用4bytes,用来前后兼容。

Tail包括了SCN中SCN base的低位(low-order)2bytes,然后是block type,还有Sequence number。每当block被读的时候,都要检查Tail与block header是否一致,保证了这个block不是损坏的(corrupted)。

2) The Transaction Header:

一共占据48bytes,包括24bytes的控制信息,和一系列的Interested Transaction Slot (ITS)。这些ITS组合在一起称为Interested Transaction List (ITL)。初始的ITL slot数量由INITRANS决定(index branch block只有1个slot)。如果有足够的剩余空间,oracle会根据需要动态的分配这些slot,直到受到空间限制或者达到了MAXTRANS。

Block header dump:0x00c0007a

Object id on Block? Y

seg/obj: 0x806dcsc: 0x00.68d714itc: 2flg: Otyp: 1 - DATA

fsl: 0fnx: 0x0 ver: 0x01

ItlXidUbaFlagLckScn/Fsc

0x010x0004.00b.00000fac0x00801885.008c.56--U-1fsc 0x0000.0068d716

0x020x0000.000.000000000x00000000.0000.00----0fsc 0x0000.00000000

24bytes的控制信息包括:

Object number(seg/obj):占用4bytes,指在OBJ$中记录的segment的object number(0x806d=32877)

Cleanout SCN(csc):占用6bytes,最后一次full cleanout的scn

ITL count(itc):占用1byte,ITL的slot数量。

Flag:占用2bytes。O表示这个block在freelist上。否则flag为”-”

Block type:占用1byte。1=data; 2=index

ITL freelist slot(fsl):占用1byte。Index to the first slot on the ITL freelist

Next freelist block(fnx):占用4byte。Segment freelist中下一个block的RDBA

Version:1 byte

Unused:4bytes,用来前后兼容。

每个ITL entry包括以下的内容:

Transaction id(Xid):8bytes。其中包括rollback segment number, transaction table中的slot number等。

Undo block address(Uba):8bytes。其中包括rollback segment block的DBA,sequence number等。

Flags:1nibble。----= transaction is active, or committed pending cleanout

C--- = transaction has been committed and locks cleaned out

-B-- = this undo record contains the undo for this ITL entry

--U- = transaction committed (maybe long ago); SCN is an upper bound

---T = transaction was still active at block cleanout SCN

Locks:3nibbles.也就是所谓的行级锁(row-level locks)

SCN or free space credit:6bytes.如果这个事务已经clean out,这个值就是SCN;否则,前两个字节表示由这个事务释放的此block中的空间数。

3)Data Area

包括14bytes的data header,4bytes/table的table dictionary,2bytes/row的row dictionary。table dictionary主要用于cluster block中,只不过table block中的table dictionary只有一个table。

data_block_dump,data header at 0x552105c

===============

tsiz: 0x1fa0==> total data area size

hsiz: 0x14==> data header size(14+ntabs*4 + nrows*2)

pbl: 0x0552105c==> pointer to buffer holding the block

bdba: 0x00c0007a==> block dba / rdba

76543210

flag=--------==> n=pctfree hit (clusters),f=don’t put on freelist, k=flushable cluster keys

ntab=1==> number of tables (>1 so this is a cluster)

nrow=1==> number of rows

frre=-1

fsbo=0x14==> free space begin offset

fseo=0x1f9b==> free space end offset

avsp=0x1f83==> available space in the block

tosp=0x1f83==> total available space when all transactions commit

0xe:pti[0]nrow=1offs=0

0x12:pri[0]offs=0x1f9b

block_row_dump:

tab 0, row 0, @0x1f9b==> 3bytes row header

tl: 5 fb: --H-FL-- lb: 0x1 cc: 1

col0: [ 1]61==> column length(1 byte if length<250; otherwise 3 bytes) and values

end_of_block_dump

5.对于一个没有插入任何row的block来说,并且假设使用了默认的INITRANS,它的大小应该是:

db_block_size- (cache header+ transaction header +data header + Tail + table dictionary*ntab + row dictionary*row )=8192 - ( 20+48+14+4+4 +0)=8192 - 90 =8102 bytes

小结:

这篇文章的目的在于给大家一个对data block的大概认识,和碰到问题时的一个参考。不是自己的,多研究,多做实验,把心得写出来,变成自己的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值