SQL Server2005数据库优化报告

     本次数据库调优的目的是从SQLServer配置选项和SQL Server2005/2008的“新”特性入手,从整体或局部上找到提升数据库性能的方法或建议。本次项目不会针对业务中的具体功能、结构、数据、查询进行优化,但是会使用它们作为对比、验证的素材。

1.  SQL Server性能配置选项

      SQL Server配置选项会影响SQLServer运行环境和执行计划,其中对性能调优有影响的包括: Affinity Mask、大内存开关、内存配置选项、并行性开销阈值、最大并行度、填充因子(%)、最大工作线程等。

下表列出了详细的配置选项说明、设置范围及其默认值。配置选项按以下字母代码标记:

l  A ——高级选项,需要将show advanced options设为1。

l  RR ——需要重新启动数据库引擎的选项。

l  SC ——自配置选项。

配置选项

中文名称

选项说明

最小值

最大值

默认值

建议

affinity(64) mask

(A,RR)                            

处理器IO关联掩码

SQL Server处理线程与指定的 CPU 子集绑定。

位掩码形式。

-2147483648

2147483647

0(不绑定)

原理是减少线程在不同CPU之间的转移,从而节省开销,主要应用于多CPU(如8个或更多)和多SQL Server实例的场景。

建议一般采用默认值

affinity(64) I/O mask

(A)

处理器关联掩码

SQL Server 磁盘 I/O 与指定的 CPU 子集绑定。

位掩码形式。

-2147483648

2147483647

0(不绑定)

原理是减少IO控制在不同CPU之间的转移,从而节省开销,主要应用于多CPU(如8个或更多)等高端应用场景。

建议一般采用默认值

AWE enabled

(A,RR)

大内存开关

允许SQL Server使用超出系统虚拟内存的物理内存。

0

1

0(不启用)

启用大内存,需要操作系统支持,即开启PAE(boot.ini)开关。

在32位操作系统中,如果物理内存超过4G,建议开启AWE开关

在64 位操作系统上不需要也不能配置 AWE

max server memory

(A,RR)

最大内存

SQL Server 实例所使用的缓冲池的最大内存量 (MB)。

16

2147483647

2147483647

如果服务器上运行多个SQL Server实例,且需要定量分配内存时,才需要考虑设置。

建议一般采用默认值

min server memory

(A,RR)

最小内存

SQL Server 实例所使用的缓冲池的最小内存量 (MB)。

0

2147483647

0

建议一般采用默认值

max degree of parallelism

(A)

最大并行度

设置并行计划执行时所用的处理器数。

0

64

0

affinity(64) mask选项的影响。设置参考affinity(64) mask选项。

建议一般采用默认值

cost threshold for parallelism

(A)

并行度开销阀值

SQL Server 创建和运行并行查询计划的阈值(秒)。

0

32767

5

原理是处理一定规模、较长时间的操作时,将使用更多线程,交给多个CPU处理,以提高性能。但是在更多线程也意味着更多开销。需要根据实际情况设置并验证该值。

建议一般采用默认值

fill factor

(A,RR)

填充因子

SQL Server使用现有数据创建新索引时将每页填满到什么程度

0

100

0(填充满)

原理是减少增加索引时避免页拆分,从而提高性能,但是会增加读负担。

建议一般采用默认值

另外,对于ERP来说最好能够使用顺序ID替换GUID。

max worker threads

(A,RR)

最大工作线程

SQL Server 进程可使用系统的工作线程数。

128

32767

0

当服务器有很多连接时,每个连接时,每个连接使用一个线程就可能占用大量的系统资源,使用max worker threads 选项可以使 SQL Server为大量连接创建一个工作线程池,共用线程,从而提高性能。

对于32位SQL Server,建议最大为1024对于64位SQL Server,建议最大为 2048。

注:以上选项多为建议采用默认值,对于需修改默认值的场景,必须分析验证后才能更改。


2.  SQL Server性能相关特性分析测试

         SQL Server 2008推出了许多新的特性和关键的改进,涉及到各个方面,其中对性能调优有影响的包括:数据压缩、表值参数、分区表、包含列、稀疏列、分组集合、HIERARCHY ID、日期数据类型、备份压缩等。

2.1.数据压缩

SQL Server 2008开始支持数据压缩功能,数据压缩分为行压缩和页压缩两种模式。

行压缩主要是通过压缩变长数据类型以及空值等实现的;

页级别压缩是在行压缩的基础上,进一步压缩了页内的一行或多行冗余数据,效果比页压缩更好。

行页压缩可以减少数据占用空间,减少数据访问的I/O和内存占用,但是会增加还原时CPU和内存的负担。

页压缩也是本次项目主要测试的特性,一共进行了以下几组测试:

2.1.1.     简单的表扫描测试

l  测试目的

验证在最普通的表扫描的情况下页压缩的表现。

l  测试数据

新建测试表test,5个字段,插入10w条记录,无索引。

l  测试查询

select * from test

l  测试结果

轮次

CPU

Duration

Reads

Writes

RowCounts

压缩前

88

2116

594

0

100000

行压缩后

120

2083

512

0

100000

页压缩后

167

2079

196

0

100000

注:测试结果为执行3次查询平均值,以下同。

l  测试小结

测试过程中,服务器CPU、内存、磁盘都没有出现高负荷的状态。

对数据压缩后,数据库读取次数明显降低(绝对值都不高),但是CPU执行时间也明显提高了,因此整个执行时间基本持平。

2.1.1.     高IO的表扫描测试

l  测试目的

验证在高IO的表扫描的情况下页压缩的表现。

l  测试数据

测试表,64个字段,1000w条记录,在Iid上创建聚集索引。

l  测试查询

select * from TestPerf whereName='名称:.2.1.1.2.21'

l  测试结果

轮次

CPU

Duration

逻辑读

物理读

预读

压缩前

12907

85821

898299

12185

892737

页压缩后

10031

10348

108717

733

101431

l  测试小结

压缩前,服务器CPU和内存都有一定负载、磁盘出现高负荷的状态,压缩后,磁盘负荷下降明显。

对数据压缩后,数据库读取次数大幅降低,CPU执行时间也明显降低提高(分析主要体现在CPU花费对磁盘IO的控制上),整个执行时间大幅度降低。

2.1.1.     表查找测试

l  测试目的

验证在使用索引(聚集或者非聚集)的表查找的情况下页压缩的表现。

l  测试数据

测试表,64个字段,1000w条记录,在Iid上创建聚集索引。

l  测试查询

select * from TestPerf whereIid='406953'

l  测试结果

轮次

CPU

Duration

逻辑读

物理读

预读

压缩前

0

3

4

0

0

页压缩后

0

8

3

0

0

l  测试小结

测试过程中,服务器CPU、内存、磁盘都没有出现高负荷的状态。

读取和执行时间都很少,压缩前后基本持平。


2.1.1.     ERP高IO的查询测试

l  测试目的

以ERP项目跟踪文件IO Top20的实际查询和实际业务数据库作为测试环境,选取其中部分查询,测量页压缩的表现。

l  测试数据

备份的数据库。

l  测试查询

Rank2

SELECT  

bnxfb.bunameAS '公司名称', 

bnxfb.projnameAS '项目名称', 

bnxfb.xmfqnameAS '分期', 

bnxfb.bldnameAS '楼栋名称', 

r.roomAS '房间编码', 

c.cstallnameAS '客户名称',

 c.contractnoAS '合同编号', 

c.payformnameAS '付款方式',

 c.zqdateAS '签约日期',

 c.rmbhttotalAS '合同总价', 

c.ajbankAS '按揭银行',

 c.ajtotalAS '按揭金额',

 c.ywyas '业务员'

,(selectserviceproc  froms_SaleService ss where ss.serviceitemlike '按揭贷款'and ss.contractguid=c.contractguid)AS'按揭贷款进程' 

,(selectcompletedate  froms_SaleService ss where ss.serviceitemlike '按揭贷款'and ss.contractguid=c.contractguid)AS'按揭贷款时间' 

,(selectyhfht  from s_SaleService ss  where ss.serviceitemlike '按揭贷款'and ss.contractguid=c.contractguid)AS'银行返合同时间' 

,(selectserviceproc  froms_SaleService ss where ss.serviceitemlike '合同登记'and ss.contractguid=c.contractguid)AS'合同登记进程' 

,(selectcompletedate  froms_SaleService ss where ss.serviceitemlike '合同登记'and ss.contractguid=c.contractguid)AS'合同登记时间' 

,(selectserviceproc  froms_SaleService ss where ss.serviceitemlike '预告登记'and ss.contractguid=c.contractguid)AS'预告登记进程' 

,(selectcompletedate  froms_SaleService ss where ss.serviceitemlike '预告登记'and ss.contractguid=c.contractguid)AS'预告登记时间' 

,(selectserviceproc  froms_SaleService ss where ss.serviceitemlike '抵押登记'and ss.contractguid=c.contractguid)AS'抵押登记进程' 

,(selectcompletedate  froms_SaleService ss where ss.serviceitemlike '抵押登记'and ss.contractguid=c.contractguid)AS'抵押登记时间' 

FROM s_Contractc

INNER JOINp_room r ON c.roomguid=r.roomguid 

INNER JOINvs_BuNameOrXmFqOrBld bnxfbON r.BldGUID= bnxfb.BldGUIDand r.bldguidin ( '27515d2a-f6a3-4625-b3bd-a33097ae7f3b',. . . . .

,'eb64076d-addb-4e63-a4ff-4b73e32e012c')

Rank7

exec usp_s_JtRbQylb @dtQueryDate ='2010-07-28'

Rank10

SELECT

SurName,GivenName, CstName, Gender,MobileTel, OfficeTelQh, OfficeTel,OfficeTelFj, HomeTel, HomeTelQh,Preferred, Email,

IsGfJcz,Country, BirthDate, CardID,Address, PostCode, IsYz,CstGUID, CstType, BizLicence,Corporation,

JzYt,Family, Znsl, BuyHouseTimes,Work, EduLevel,isBmTz,

CognizeAve,MtZl, GfYs, Gfyt,XqTs, GzQs, GzJg,Competitor, XmGz1, XmGz2,XmGz3, Probability, ywy,

Status,OppSource, OppStatus,         

WorkArea,HomeArea, null as NextGjDate,null as NextGjNr, OppGUID,UserGUID, FailType, statusReason,

Closedon,Description,userName,dfNum, Gjfs, NextGjNras GjNr,Bz, Gjxw, CstProjGUID      

FROM vs_ClientOpp      

WHERE (CstProjGUID='8673F638-E3A4-4702-955D-855CE99B193301248036-1BBB-42FE-9A61-72B6920FC691')

l  测试结果

Rank2

轮次

CPU

Duration

Reads

Writes

RowCounts

压缩前

1828

1983

397514

0

18712

页压缩后

1844

2063

397392

0

18712

Rank7

轮次

CPU

Duration

Reads

Writes

RowCounts

压缩前

156

319

24405

0

19

页压缩后

172

342

5176

0

19

Rank10

轮次

CPU

Duration

Reads

Writes

RowCounts

压缩前

12921

8189

56866

0

1

页压缩后

13580

8371

28014

0

1

l  测试小结

因为数据原因只选取了TOP20其中3条语句进行测试。

页压缩普遍的结果是在可以不同程度的减少读取(取决于结构、数据和查询),但是都会造成CPU处理时间增加,总的执行时间都有小幅度的增加。分析主要有:

首先,ERP系统中的查询基本上都已经建立了索引,页压缩的作用已经被弱化了;

其次,在读取数量并不大的情况下(Rank7和Rank10),页压缩的作用也不明显;

再次,因为数据库本身具有缓存机制,也会弱化页压缩的作用;

另外,对于读取数量很大的Rank2的情况,主要是因为结构和查询的原因,导致读取也不能下降。


2.2.1.     批量数据插入测试

l  测试目的

使用测试数据,对比验证使用普通参数逐条插入数据和使用表值参数批量插入数据在执行时间和资源开销上的差异。

l  测试数据

测试数据库,一个简单的id和name的表,插入1万条记录。

l  测试查询

普通参数逐条插入

declare @i int

set @i=1

while @i<10000

begin

    exec usp_i1@i,'name'

    set @i=@i+1

end

表值参数批量插入

declare @u as tp10

declare @i int

set @i=1

while @i<10000

begin

    INSERT @u VALUES(@i,'name')

    set @i=@i+1

end

exec usp_i2@u

l  测试结果

轮次

CPU

Duration

Reads

Writes

RowCounts

普通参数逐条插入

1204

5943048

10285

33

29998

表值参数批量插入

408

571046

21398

62

39997

注:以上数据为1w次插入之和

l  测试小结

从以上的测试结果来看,使用表值参数批量插入相对于普通参数逐条插入在执行时间上提升幅度非常大,使用的CPU资源也大幅降低,在IO上会有所增加,但是增加比例不大,而且都是逻辑读写,物理读写并不会增加。总的说来,建议在批量插入数据时,使用表值参数批量插入。

另外,使用ADO.NET编程也非常方便使用表值参数,DataTable即可以作为表值参数使用,如以上查询改为ADO.NET实现:

using (connection)

{

DataTable dt = GetMyTable();

string sqlInsert = "INSERT INTO test10 SELECT * from @u"

SqlCommand insertCommand = new SqlCommand(

    sqlInsert, connection);

SqlParameter tvpParam = insertCommand.Parameters.AddWithValue(

    "@u", dt);

tvpParam.SqlDbType = SqlDbType.Structured;

tvpParam.TypeName = "tp10";

insertCommand.ExecuteNonQuery();

}

2.2.1.     IdString查询测试

l  测试目的

使用测试数据,对比验证当Id很多时(比如测试使用的200个),使用字符串形式的IdString查询和使用表值参数形式的IdString查询在执行时间和资源开销上的差异。

l  测试数据

测试数据库,一个简单的id(uniqueidentifier)和name的表,10万条记录。

l  测试查询

字符串形式IdString查询

select * from test13 whereid in('C403DBAA-B7F3-4CB1-9AD4-F2A06BCFDDA4',. . . . . .,'D0F292D4-8264-40D5-8112-690B0A8B7204')

表值参数形式IdString查询

declare @p tp13

insert into@p values('C403DBAA-B7F3-4CB1-9AD4-F2A06BCFDDA4')

. . . . . .

insert into@p values('D0F292D4-8264-40D5-8112-690B0A8B7204')

select * from test13 whereid in(selectid from @p)

l  测试结果

轮次

CPU

Duration

Reads

Writes

RowCounts

字符串形式IdString查询

390

394

489

0

112

表值参数形式IdString查询

47

90

618

0

224

注:使用表值参数形式IdString查询为所有语句之和

l  测试小结

字符串形式IdString查询,因为字符串很长,SQL Server解析字符串消耗的CPU时间很长;而使用表值参数形式IdString查询,则能大大的降低CPU时间和总的执行时间。读取次数会少量增加,但是相对于查询本身来说非常小,而且增加的都是逻辑读写,物理读写并不会增加。建议在IdString查询时,使用表值参数形式。

使用ADO.NET中的DataTable就可以作为表值参数传递,用法参考上一个例子。

2.1.分区表

SQL SERVER 2005引入了分区表的功能。分区表从物理上将一个大表分成若干个小表,从逻辑上提供和普通表相同的功能。

分区表可以根据实际需要访问数据,避免整个大表的访问,提高查询性能;而且分区表对应的数据可以保存在不同的文件和磁盘中,这在磁盘压力较大的时候也可以对性能有很大提升。

因为分区表的存储特性是按分区字段物理拆分成若干小表,因此分区表的聚集索引只能建立在该分区字段上,如果另外建立,分区表将转换为普通表。通过建立聚集索引并且应用分区方案,也可以将普通表转换为分区表。

l  测试目的

使用测试数据,针对以上对性能可能存在影响的点,对比验证使用普通表和分区表在查询时的效果。特别关注索引情况。

l  测试数据

两个测试表,字段都包括编号、姓名、月度、数量。

表一为普通表,在月度建立聚集索引、编号上建立唯一非聚集索引,120w条记录。

表二为分区表,采用月度作为分区字段,实际包含12个小表,每个小表10w条记录。编号上建立唯一非聚集索引。1—6月的数据文件保存在D盘,7—12月的数据文件保存在E盘。

测试完毕后去掉索引。

l  测试查询

根据编号取一条记录

select *from test11 where id=800000

select * from test12 whereid=800000

分组取某个月统计数据

select MAX(num),[MONTH]from test11 where [MONTH]=12group by [MONTH]

select MAX(num),[MONTH]from test12 where [MONTH]=12group by [MONTH]

取某些月份数据,并且加上一些计算

select *,num2=case[MONTH]%2 when 0 then num*1.111111+100else num*1.222222+80end from test11 where [MONTH]between 2 and 5

union

select *,num2=case[MONTH]%2 when 0 then num*1.111111+100else num*1.222222+80end from test11 where [MONTH]between 8 and 11

 

select *,num2=case[MONTH]%2 when 0 then num*1.111111+100else num*1.222222+80end from test12 where [MONTH]between 2 and 5

union

select *,num2=case[MONTH]%2 when 0 then num*1.111111+100else num*1.222222+80end from test12 where [MONTH]between 8 and 11

分组取某个月统计数据,去掉索引

select MAX(num),[MONTH]from test11 where [MONTH]=12group by [MONTH]

select MAX(num),[MONTH]from test12 where [MONTH]=12group by [MONTH]

分组取某个月统计数据,只在表一的月度上建立非聚集索引

select MAX(num),[MONTH]from test11 where [MONTH]=12group by [MONTH]

select MAX(num),[MONTH]from test12 where [MONTH]=12group by [MONTH]

l  测试结果

根据编号取一条记录

轮次

CPU

Duration

Reads

Writes

RowCounts

普通表

0

0

6

0

1

分区表

0

0

6

0

1

分组取某个月统计数据

轮次

CPU

Duration

Reads

Writes

RowCounts

普通表

47

37

438

0

1

分区表

31

36

437

0

1

取某些月份数据,并且加上一些计算

轮次

CPU

Duration

Reads

Writes

RowCounts

普通表

1141

13765

3480

0

799992

分区表

1265

13150

3496

0

799992

分组取某个月统计数据,去掉索引

轮次

CPU

Duration

Reads

Writes

RowCounts

普通表

250

121

5213

0

1

分区表

47

41

437

0

1

分组取某个月统计数据,只在表一的月度上建立非聚集索引

轮次

CPU

Duration

Reads

Writes

RowCounts

普通表

238

126

5213

0

1

分区表

47

45

437

0

1

l  测试小结

分区表最大的作用就是根据分区函数,确定小表,避免大表中查询,从而减少开销,提升性能,这点在“分组取某个月统计数据,去掉索引”和“分组取某个月统计数据,只在表一的月度上建立非聚集索引”测试中可以明显体现(实际上两者的执行效率是一样的),该测试中因为分区表只需要访问12个小表中的1个小表,数据读取减少为1/12,查询时间也大大的减少。但是分区表的局限性也在于此,它只是起了部分聚集索引的作用,如果把聚集索引建立好,减少访问的作用就消失了,如测试“根据编号取一条记录”和“分组取某个月统计数据”中,普通表和分区表的各方面表现基本是一致的。

对于ERP系统而言,我觉得如果遇到类似问题,首先需要考虑的,还是我们的索引是否合理,而不是我们是否需要建立分区表。如果考虑采用分区表,我们需要结合查询和索引的情况综合考虑,确保它能够对查询带来帮助。

其次,分区表可以把数据文件分别存储在不同的磁盘中,这在磁盘负荷很大的时候,分散磁盘压力、提高访问速度应该有一定好处(实际上,普通表也可以分别放在不同的文件和磁盘中,也是在性能调优时可以考虑的手段),不过在测试“取某些月份数据,并且加上一些计算”中,受环境限制,未能充分证明。

另外,分区表在大数据量的并发操作、数据插入页拆分等方面应该都有好处,这些只是简单分析,没有深入去验证。

使用分区表,在备份数据库时,如果选择了基于文件或文件组的备份策略,则应执行文件或文件组备份。如果选择了基于整个数据库的备份策略,则可以执行完整数据库备份或差异备份。

使用分区表只需在数据层进行维护,对于应用程序而言没有影响。

总的说来,暂时没有发现使用分区表会带来需要关注的负面影响,在ERP中如果有些数据量很大的表中,数据具有明显的分段标识,而且某一时刻或者某一场景只会访问其中某段数据,那么建议采用分区表。

2.2.包含列

在SQLServer2005中,可以通过将非键列添加到非聚集索引的叶级别来扩展非聚集索引的功能。通过包含非键列,可以创建覆盖更多查询的非聚集索引。这样做有以下好处:可以是不允许作为索引键列的类型;可以在避免索引键列数或索引键大小的限制(最大键列数为 16,最大索引键大小为 900 字节)。如果查询的字段被包含在包含列中,还可以避免再次的堆或者聚集索引查询。

l  测试目的

使用测试数据,对比验证使用包含列索引覆盖查询和不使用索引以及使用普通索引对的差别。对于因为索引列限制无需测试。

l  测试数据

测试表,10w条记录。包含编号、名称、编码、说明以及一些数字,假设最常使用名称、编码作为条件查询编号、名称、编码和某些数字字段数据。在编号上建立唯一聚集索引,再分别建立名称、编码的覆盖索引和包含列覆盖索引。

l  测试查询

select Id,name,code,n1,n2,n3,n4,n5from test14 where name='name70'and code=170

l  测试结果

空间

轮次

rows

reserved

data

Index_size

unused

不使用索引

100000    

7584 KB

7312 KB

48 KB

224 KB

覆盖索引

100000    

10304 KB

7312 KB

2568 KB

424 KB

包含列覆盖索引

100000    

12216 KB

7312 KB

4592 KB

312 KB

执行计划

轮次

计划

不使用索引

覆盖索引

包含列覆盖索引

查询

轮次

CPU

Duration

Reads

Writes

RowCounts

不使用索引

15

14

918

0

50

覆盖索引

6

125

189

0

50

包含列覆盖索引

1

2

3

0

50

l  测试小结

不使用索引时读取很大,但是表扫描的执行时间并不慢;

使用普通覆盖索引时,因为需要的数据不包含在非聚集索引叶级节点中,产生了嵌套循环(也就是Bookmark Lookup),导致执行时间更慢,但是确实它的读取相对于不使用索引少了很多;

使用包含列覆盖索引后,完全就是索引查找,读写和执行时间都大大提升。

由此可见,在我们需要经常查询一些数据,而这些数据并不大(太大的话,也会造成索引增大,反而使读取性能下降),而且不会作为查询条件时,我们应该把这些列包含在索引中;另外在遇到索引列(数量和长度)限制时,我们应该采用包含列覆盖索引。

目前在ERP中,包含列索引用得不多,共计2500多个列上存在索引,其中22个为包含列。

2.3.稀疏列

SQL Server 2008支持稀疏列属性,稀疏列主要是为了提供一种更有效的存储机制,稀疏列当列为空值时就不占空间可以节省空间,从而达到节省空间,降低IO的效果。但是使用稀疏列也会带来额外的开销,并且稀疏列中当列不为空值时占用的空间更大。

l  测试目的

使用测试数据,验证稀疏列能节省多少存储空间和IO,对于性能正面和负面的影响以及影响的大致数量。

l  测试数据

测试数据库,五个表,分别使用varchar(32)和bigint普通列和稀疏列(集),10万条记录。

l  测试查询

select *from test5 --varchar(32)

select *from test6 --varchar(32) SPARSE NULL

select *from test7 --bigint

select * from test8 --bigint SPARSE NULL

select * from test9 --bigint SPARSE NULL COlUMN SET

l  测试结果

空间

轮次

rows

reserved

data

Index_size

unused

varchar(32) 普通列

100000    

5000 KB

4976 KB

8 KB

16 KB

varchar(32) 稀疏列

100000    

4808 KB

4768 KB

8 KB

32 KB

bigint 普通列

100000    

11016 KB

10960 KB

8 KB

48 KB

bigint 稀疏列

100000    

4488 KB

4472 KB

8 KB

8 KB

bigint 稀疏列集

100000    

4488 KB

4472 KB

8 KB

8 KB

查询

轮次

CPU

Duration

Reads

Writes

RowCounts

varchar(32) 普通列

94

2125

626

0

100000

varchar(32) 稀疏列

103

2135

600

0

100000

bigint 普通列

78

2132

1380

0

100000

bigint 稀疏列

141

1984

565

0

100000

bigint 稀疏列集

1657

23396

565

0

100000

l  测试小结

稀疏列主要用于处理一个实体有很多属性,但很多属性都可能为空值,而且非空值比例不高的场景,这也被称为“属性集问题”。这种场景下,为了节省空间,往往在表结构设计时会考虑用主从表的方式,在从表中用行表示列属性,这样就会给查询带来额外的开销,这种应用也适合用稀疏列解决。

稀疏列是对空值采用优化的存储方式的列,“稀疏”只是列的属性,而并非一个新的类型。稀疏列减少了空值的空间需求,但代价是检索非空值的开销增加。节省的空间和IO,和列的类型以及非空值比例有密切关系,特别是对定长的列特别有效,只有当使用稀疏列能节省较大的空间和IO时才需要考虑使用。

另外,稀疏列往往和列集一起使用,列集是所有稀疏列的集合,使用XML格式返回,当定义了列集时,单独查询稀疏列需要加上Not Null条件。稀疏列是通过使用CREATE TABLE或ALTER TABLE语句定义的,对于应用程序没有影响,但是使用列集时返回的是非空值集合的XML结构数据,这可能适用于特定场景。使用列集查询,性能会下降很多。

2.4.分组集合

SQL Server 2008支持分组集合(GROUPINGSETS)功能,分组集合是对GROUP BY条件语句的扩展,它使得用户可以在同一个查询中定义多个分组。分组集合生成一个单独的结果集,这个结果集相当于对不同分组的行进行了UNION ALL的操作,这使得聚合查询更加简单和快速。

l  测试目的

使用测试数据,对比普通分组统计和采用分组集合统计的差异。

l  测试数据

测试数据库,一个表,包含三个维度统计字段,10万条记录。

l  测试查询

select d1,SUM(num)from test15 group by d1

select d2,SUM(num)from test15 group by d2

select d3,SUM(num)from test15 group by d3

 

select d1,d2,d3,SUM(num)from test15 group by GROUPINGSETS (d1,d2,d3)

l  测试结果

轮次

CPU

Duration

Reads

Writes

RowCounts

普通分组统计1

94

92

368

0

3

普通分组统计2

78

96

368

0

3

普通分组统计3

96

115

368

0

3

普通分组统计和

268

303

1104

0

9

分组集合统计

203

277

385

0

9

l  测试小结

测试结果很明显,使用分组集合统计可以将数据IO大幅度减少,提升查询性能。在对同一个表中不同的维度进行分组统计时(如报表类型的应用),建议使用分组集合统计。

2.5.HierarchyId

SQL Server 2008通过CLS提供新的HierarchyId类型,用于层级代码的实现。该类型通过一些列的方法实现层级树的查找功能。

l  测试目的

使用测试数据,对比验证使用HierarchyId类型是否能够相对于ERP的层级代码提供更高的性能和更强的功能。

l  测试数据

两个测试表,分别使用HierarchyId类型和ERP层级代码保存树形结构数据,5级,约7500条记录,在层级代码上创建唯一、非聚集索引。

l  测试查询

--获取节点1.4的所有子节点

select * from test3 wherehid like '1.4%' order byhid

 

declare @parent hierarchyid

set @parent=CAST('/1/4/'as hierarchyid)

select hid.ToString(),uid,namefrom test4 where hid.IsDescendantOf(@parent)=1order by hid

l  测试结果

轮次

CPU

Duration

Reads

Writes

RowCounts

ERP层级代码

0

101

37

0

91

HierarchyId

0

147

34

0

91

l  测试小结

HierarchyId类型主要优势在于能够提供更丰富、更灵活的树形结构查询功能,能较为简便的实现某些功能(如下取所有上级),另外,因为HierarchyId类型采用二进制存储,能少量节省存储空间。

但是HierarchyId类型查询性能方面并不会比字符串的索引查找更有提升,而且使用HierarchyId需要CLR支持,还需要掌握该类型专门的语法,这套语法与ERP目前对层级代码的使用是不兼容的。

附:用HierarchyId类型取所有上级

--获取节点.4.3.2的所有父节点

declare @child hierarchyid

set @child=CAST('/1/4/3/2/'as hierarchyid)

select hid.ToString(),uid,namefrom test4 where @child.IsDescendantOf(hid)=1order by hid

附:HierarchyId类型提供的主要方法

n  GetAncestor:取得某一个级别的祖先

n  GetDescendant:取得某一个级别的子代

n  GetLeve:取得级别

n  GetRoot:取得根

n  IsDescendantOf:判断某个节点是否为某个节点的子代

n  Parse:将字符串转换为hierarchyid。该字符串的格式通常都是/1/这样的

n  Read:Read 从传入的 BinaryReader 读取 SqlHierarchyId 的二进制表示形式,并将 SqlHierarchyId 对象设置为该值。不能使用 Transact-SQL 调用 Read。请改为使用 CAST 或 CONVERT。

n  GetReparentedValue:可以用来移动节点(或者子树)

n  ToString:将hierarchyid转换为字符串,与parse正好相反

n  Write:Write 将 SqlHierarchyId 的二进制表示形式写出到传入的 BinaryWriter 中。无法通过使用 Transact-SQL 来调用 Write。请改为使用 CAST 或 CONVERT。

2.6.使用Date类型

SQL Server 2008支持新的日期类型Date,Date类型不包含时间部分,长度从DateTime的8位减少为3位,在不需要时间的日期类型中使用Date类型可以减少磁盘空间、数据IO以及相应的CPU控制。

l  测试目的

使用测试数据,对比采用DateTime和Date类型的查询,验证Date类型的效果。

l  测试数据

两个测试表,各10万条记录、 6个字段,其中一个DateTime或Date类型字段。

l  测试查询

select *from test1

select * from test2

l  测试结果

轮次

CPU

Duration

Reads

Writes

RowCounts

DateTime

94

2043

594

0

100000

Date

78

1975

529

0

100000

l  测试小结

对于ERP中的DateTime类型而言,绝大部分不需要Time部分,因此可以考虑采用Date类型。使用Date类型对性能有小幅提升。

可以使用“alter table t alter column d date”将DateTime类型改为Date类型,修改后将去掉时间部分,日期部分不变。在应用系统中访问Date类型和DateTime类型是一样的,也就是说应用需不需要修改。

2.7.备份压缩

SQL Server 2008支持备份压缩功能,备份压缩采用与数据压缩相同的原理,在数据库备份时实现压缩备份,从而减少备份文件磁盘空间占用,并降低备份操作IO。

l  测试目的

使用测试数据,对比是否采用压缩备份,验证备份压缩的效果。

l  测试数据

测试数据库,一个表,1000万条记录。

l  测试查询

BACKUP DATABASEPerfTest TO DISK='D:\PerfTest.BAK'WITH NO_COMPRESSION

BACKUP DATABASEPerfTest TO DISK='D:\PerfTest1.BAK'WITH COMPRESSION

l  测试结果

轮次

DATABASE_NAME

BACKUP_SIZE

COMPRESSED_BACKUP_SIZE

不压缩

PerfTest

7458816

7458816

压缩

PerfTest

7458816

1088465

l  测试小结

在备份时可以考虑采用备份压缩。

总结

究其原因,我认为除开受个人对业务应用和专业技能认知程度的限制外,更重要的原因还是出发的目的,就当前基于SQL Server数据库的应用系统来说,性能调优投入产出比最高的在于数据库设计和应用程序,对于硬件、操作系统和数据库配置而言,投入产出比较低,大致如图:

也就是说,未来我们数据库调优的重点还应该是在数据库设计和应用程序上。本次项目有关SQL Server2005/2008的“新”特性的研究、测试,目的就在于此。本次梳理的对ERP有价值的一些特性汇总于下表:

特性

2005

支持

2008

支持

I/O

CPU

使用建议

数据压缩

×

在CPU负载较低、磁盘和数据库读写负载较高的情况下,可以考虑采用数据压缩。

表值参数

×

在批量插入和批量查询等场景,建议采用。

注:这里增加的I/O是逻辑IO,而非物理I/O。

分区表

如果大量数据具有明显的分段标识,且业务通常只会访问其中某段数据,建议采用分区表。

包含列

如果经常查询的数据不大,而且不会作为查询条件,建议采用包行列;另外在遇到索引列也可以考虑采用包行列。

稀疏列

×

当使用稀疏列能节省较大的空间和IO时才考虑使用。

分组集合

×

当对同一数据不同维度进行分组统计时(如报表类型的应用),建议使用分组集合统计。

Hierarchy Id

×

提供了更灵活强大的功能,性能基本和层级代码相当。如果重新设计,可以考虑采用。

Date类型

×

对不需要时间部分的日期类型,建议采用。

备份压缩

×

数据备份时建议采用。

在后续的项目中,可以结合上表和实际情况予以实际应用。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
书名: SQLServer2008查询性能优化 作者: 弗里奇(Grant Fritchey) 出版社: 人民邮电出版社 出版日期: 2010年8月1日 ISBN: 9787115230294 编辑推荐 《SQL Server 2008查询性能优化》为你提供了处理查询性能所需要的工具。建立、维护数据库和数据库服务器可能是个困难的工作。当服务器的运行越来越慢时,这个工作就变得更加困难。来自用户的愤怒的电话以及站在你办公桌周围的管理人员都使你很不快活。在开发代码的同时,如果你花费时间和精力来开发一个性能故障排错的方法。那么你就能避免这种情况——至少可以快速而有效地做出反应。《SQL Server 2008查询性能优化》指出的性能要点之一是数据库随着用户和数据的日益增多而进行扩展的必要性。你需要理解性能低下的起因。以及识别并修复它们的方法。《SQL Server 2008查询性能优化》将帮助你: 使用性能监视器、SQL Trace以及动态管理视图和函数建立性能基线 理解一般系统中发生瓶颈的地方。以及解决瓶颈的方法 识别常见性能问题以及对其快速处理的方法 实施修复甚至预防性能问题的T-SQL最佳实践 《SQL Server 2008查询性能优化》不是理论书籍,它的目的是帮助你避免数据库出现性能低下的状况,它还能帮助你保住你的工作。 内容提要 《SQL Server 2008查询性能优化》通过大量实例,详细介绍了SQL Server数据库系统优化的各种方法和技巧。内容涵盖了数据库应用系统中各种性能瓶颈的表现形式及其发生的根源和解决方法,从硬件瓶颈到查询、索引设计以及数据库管理等,贯穿了数据库系统知识的各个方面。最后以一个实际的工作负载将所有技巧联系起来,并且提供了“宝典”式的最佳实践列表。 《SQL Server 2008查询性能优化》适合于关心数据库应用系统性能的开发人员和数据库管理人员阅读。通过阅读《SQL Server 2008查询性能优化》,不仅可以学习到数据库性能管理的许多知识和技巧,还有助于养成良好的编程习惯,为实现高性能的数据库应用系统打下基础。 目录 第1章 SQL查询性能调整 1 1.1 性能调整过程 2 1.1.1 核心过程 2 1.1.2 迭代过程 4 1.2 性能vs.价格 7 1.2.1 性能目标 7 1.2.2 “足够好”的调整 7 1.3 性能基线 8 1.4 工作的重点 9 1.5 SQL Server性能杀手 10 1.5.1 低质量的索引 10 1.5.2 不精确的统计 11 1.5.3 过多的阻塞和死锁 11 1.5.4 不基于数据集的操作 11 1.5.5 低质量的查询设计 12 1.5.6 低质量的数据库设计 12 1.5.7 过多的碎片 12 1.5.8 不可重用的执行计划 13 1.5.9 低质量的执行计划 13 1.5.10 频繁重编译计划 13 1.5.11 游标的错误使用 13 1.5.12 错误配置数据库日志 14 1.5.13 过多使用或者错误配置tempdb 14 1.6 小结 14 第2章 系统性能分析 15 2.1 性能监视器工具 15 2.2 动态管理视图 17 2.3 硬件资源瓶颈 18 2.3.1 识别瓶颈 18 2.3.2 瓶颈解决方案 19 2.4 内存瓶颈分析 19 2.4.1 SQL Server内存管理 20 2.4.2 Available Bytes 23 2.4.3 Pages/sec和Page Faults/sec计数器 23 2.4.4 Buffer Cache Hit Ratio 24 2.4.5 Page Life Expectancy 24 2.4.6 Checkpoint Pages/sec 24 2.4.7 Lazy writes/sec 24 2.4.8 Memory Grants Pending 25 2.4.9 Target Server Memory(KB)和Total Server Memory(KB) 25 2.5 内存瓶颈解决方案 25 2.5.1 优化应用程序工作负载 26 2.5.2 为SQL Server分配更多内存 27 2.5.3 增加系统内存 27 2.5.4 更换32位处理器为64位处理器 27 2.5.5 启用3GB进程空间 28 2.5.6 在32位SQL Server中使用4GB以上内存 28 2.6 磁盘瓶颈分析 29 2.6.1 磁盘计数器 30 2.6.2 % Disk Time 30 2.6.3 Current Disk Queue Length 31 2.6.4 Disk Transfers/sec 31 2.6.5 Disk Bytes/sec 32 2.6.6 Avg. Disk Sec/Read和Avg. Disk Sec/Write 32 2.7 磁盘瓶颈解决方案 32 2.7.1 优化应用程序工作负载 33 2.7.2 使用更快的磁盘驱动器 33 2.7.3 使用一个RAID阵列 33 2.7.4 使用SAN系统 35 2.7.5 恰当地对齐磁盘 35 2.7.6 使用电池后备的控制器缓存 36 2.7.7 添加系统内存 36 2.7.8 创建多个文件和文件组 36 2.7.9 将表和索引放在不同的磁盘上 39 2.7.10 将日志文件保存到独立的物理磁盘 39 2.7.11 表的分区 40 2.8 处理器瓶颈分析 40 2.8.1 % Processor Time 41 2.8.2 % Privileged Time 41 2.8.3 Processor Queue Length 42 2.8.4 Context Switches/sec 42 2.8.5 Batch Requests/sec 42 2.8.6 SQL Compilations/sec 42 2.8.7 SQL Recompilations/sec 43 2.9 处理器瓶颈解决方案 43 2.9.1 优化应用程序工作负载 43 2.9.2 消除过多的编译/重编译 43 2.9.3 使用更多或更快的处理器 44 2.9.4 使用大的二级(L2)/三级(L3)缓存 44 2.9.5 运行更高效的控制器/驱动程序 44 2.9.6 不运行不必要的软件 45 2.10 网络瓶颈分析 45 2.10.1 Bytes Total/sec 45 2.10.2 % Net Utilization 46 2.11 网络瓶颈解决方案 46 2.11.1 优化应用程序工作负载 46 2.11.2 增加网络适配器 47 2.11.3 节制和避免中断 47 2.12 SQL Server总体性能 47 2.12.1 丢失索引 48 2.12.2 数据库阻塞 49 2.12.3 不可重用的执行计划 50 2.12.4 总体表现 50 2.13 创建一个基线 51 2.13.1 创建性能计数器的一个可重用列表 51 2.13.2 使用性能计数器列表创建一个计数器日志 54 2.13.3 最小化性能监视器开销 55 2.14 以基线为标准的系统状态分析 56 2.15 小结 57 第3章 SQL查询性能分析 58 3.1 SQL Profiler工具 58 3.1.1 Profiler跟踪 59 3.1.2 事件 60 3.1.3 数据列 62 3.1.4 过滤器 64 3.1.5 跟踪模板 65 3.1.6 跟踪数据 65 3.2 跟踪的自动化 66 3.2.1 使用GUI捕捉跟踪 66 3.2.2 使用存储过程捕捉跟踪 67 3.3 结合跟踪和性能监视器输出 68 3.4 SQL Profiler建议 69 3.4.1 限制事件和数据列 69 3.4.2 丢弃性能分析所用的启动事件 70 3.4.3 限制跟踪输出大小 70 3.4.4 避免在线数据列排序 71 3.4.5 远程运行Profiler 71 3.4.6 限制使用某些事件 71 3.5 没有Profiler情况下的查询性能度量 71 3.6 开销较大的查询 72 3.6.1 识别开销较大的查询 73 3.6.2 识别运行缓慢的查询 77 3.7 执行计划 78 3.7.1 分析查询执行计划 80 3.7.2 识别执行计划中开销较大的步骤 82 3.7.3 分析索引有效性 83 3.7.4 分析连接有效性 84 3.7.5 实际执行计划vs.估算执行计划 88 3.7.6 计划缓存 89 3.8 查询开销 90 3.8.1 客户统计 90 3.8.2 执行时间 91 3.8.3 STATISTICS IO 92 3.9 小结 94 第4章 索引分析 95 4.1 什么是索引 95 4.1.1 索引的好处 97 4.1.2 索引开销 98 4.2 索引设计建议 100 4.2.1 检查WHERE子句和连接条件列 100 4.2.2 使用窄索引 102 4.2.3 检查列的唯一性 103 4.2.4 检查列数据类型 106 4.2.5 考虑列顺序 107 4.2.6 考虑索引类型 109 4.3 聚簇索引 109 4.3.1 堆表 110 4.3.2 与非聚簇索引的关系 110 4.3.3 聚簇索引建议 112 4.4 非聚簇索引 117 4.4.1 非聚簇索引维护 117 4.4.2 定义书签查找 117 4.4.3 非聚簇索引建议 118 4.5 聚簇索引vs.非聚簇索引 118 4.5.1 聚簇索引相对于非聚簇索引的好处 119 4.5.2 非聚簇索引相对于聚簇索引的好处 120 4.6 高级索引技术 121 4.6.1 覆盖索引 122 4.6.2 索引交叉 124 4.6.3 索引连接 125 4.6.4 过滤索引 126 4.6.5 索引视图 128 4.6.6 索引压缩 132 4.7 特殊索引类型 134 4.7.1 全文索引 134 4.7.2 空间索引 135 4.7.3 XML 135 4.8 索引的附加特性 135 4.8.1 不同的列排序顺序 135 4.8.2 在计算列上的索引 136 4.8.3 BIT数据类型列上的索引 136 4.8.4 作为一个查询处理的CREATE INDEX语句 136 4.8.5 并行索引创建 136 4.8.6 在线索引创建 137 4.8.7 考虑数据库引擎调整顾问 137 4.9 小结 137 第5章 数据库引擎调整顾问 139 5.1 数据库引擎调整顾问机制 139 5.2 数据库引擎调整顾问实例 143 5.2.1 调整一个查询 143 5.2.2 调整一个跟踪工作负载 146 5.3 数据库引擎调整顾问的局限性 148 5.4 小结 149 第6章 书签查找分析 150 6.1 书签查找的目的 150 6.2 书签查找的缺点 152 6.3 分析书签查找的起因 153 6.4 解决书签查找 155 6.4.1 使用一个聚簇索引 155 6.4.2 使用一个覆盖索引 155 6.4.3 使用索引连接 158 6.5 小结 160 第7章 统计分析 161 7.1 统计在查询优化中的角色 161 7.2 索引列上的统计 162 7.2.1 更新统计的好处 162 7.2.2 过时统计的缺点 164 7.3 在非索引列上的统计 165 7.3.1 在非索引列上统计的好处 166 7.3.2 丢失非索引列上的统计的缺点 169 7.4 分析统计 172 7.4.1 密度 174 7.4.2 多列索引上的统计 174 7.4.3 过滤索引上的统计 175 7.5 统计维护 176 7.5.1 自动维护 177 7.5.2 人工维护 179 7.5.3 统计维护状态 181 7.6 为查询分析统计的有效性 182 7.6.1 解决丢失统计问题 182 7.6.2 解决过时统计问题 184 7.7 建议 186 7.7.1 统计的向后兼容性 186 7.7.2 自动创建统计 186 7.7.3 自动更新统计 187 7.7.4 自动异步更新统计 189 7.7.5 收集统计的采样数量 189 7.8 小结 190 第8章 碎片分析 191 8.1 碎片的成因 191 8.1.1 UPDATE语句引起的页面分割 193 8.1.2 INSERT语句引起的页面分割 196 8.2 碎片开销 197 8.3 分析碎片数量 200 8.4 碎片解决方案 204 8.4.1 卸载并重建索引 204 8.4.2 使用DROP_EXISTING子句重建索引 205 8.4.3 执行ALTER INDEX REBUILD语句 205 8.4.4 执行ALTER INDEX REORGANIZE语句 207 8.5 填充因子的重要性 209 8.6 自动维护 212 8.7 小结 217 第9章 执行计划缓冲分析 218 9.1 执行计划生成 218 9.1.1 解析器 219 9.1.2 代数化器 220 9.1.3 优化 221 9.2 执行计划缓冲 227 9.3 执行计划组件 227 9.3.1 查询计划 227 9.3.2 执行上下文 227 9.4 执行计划的老化 228 9.5 分析执行计划缓冲 228 9.6 执行计划重用 229 9.6.1 即席工作负载 230 9.6.2 预定义工作负载 231 9.6.3 即席工作负载的计划可重用性 231 9.6.4 预定义工作负载的计划可重用性 239 9.7 查询计划Hash和查询Hash 248 9.8 执行计划缓冲建议 251 9.8.1 明确地参数化查询的可变部分 252 9.8.2 使用存储过程实现业务功能 252 9.8.3 使用sp_executesql编程以避免存储过程维护 252 9.8.4 实现准备/执行模式以避免重传查询字符串 253 9.8.5 避免即席查询 253 9.8.6 对于动态查询sp_executesql优于EXECUTE 253 9.8.7 小心地参数化查询的可变部分 254 9.8.8 不要允许查询中对象的隐含解析 254 9.9 小结 254 第10章 存储过程重编译 256 10.1 重编译的好处和缺点 256 10.2 确认导致重编译的语句 258 10.3 分析重编译起因 260 10.3.1 架构或绑定变化 261 10.3.2 统计变化 261 10.3.3 延迟对象解析 264 10.3.4 SET选项变化 266 10.3.5 执行计划老化 266 10.3.6 显式调用sp_recompile 267 10.3.7 显式使用RECOMPILE子句 268 10.4 避免重编译 269 10.4.1 不要交替使用DDL和DML语句 270 10.4.2 避免统计变化引起的重编译 271 10.4.3 使用表变量 273 10.4.4 避免在存储过程中修改SET选项 275 10.4.5 使用OPTIMIZE FOR查询提示 276 10.4.6 使用计划指南 277 10.5 小结 281 第11章 查询设计分析 282 11.1 查询设计建议 282 11.2 在小结果集上操作 283 11.2.1 限制选择列表中的列数 283 11.2.2 使用高选择性的WHERE子句 284 11.3 有效地使用索引 284 11.3.1 避免不可参数化的搜索条件 285 11.3.2 避免WHERE子句列上的算术运算符 289 11.3.3 避免WHERE子句列上的函数 290 11.4 避免优化器提示 292 11.4.1 连接提示 293 11.4.2 索引提示 295 11.5 使用域和参照完整性 296 11.5.1 非空约束 297 11.5.2 声明参照完整性 299 11.6 避免资源密集型查询 301 11.6.1 避免数据类型转换 301 11.6.2 使用EXISTS代替COUNT(*)验证数据存在 303 11.6.3 使用UNION ALL代替UNION 304 11.6.4 为聚合和排序操作使用索引 305 11.6.5 避免在批查询中的局部变量 306 11.6.6 小心地命名存储过程 309 11.7 减少网络传输数量 311 11.7.1 同时执行多个查询 311 11.7.2 使用SET NOCOUNT 311 11.8 降低事务开销 312 11.8.1 减少日志开销 312 11.8.2 减少锁开销 314 11.9 小结 315 第12章 阻塞分析 316 12.1 阻塞基础知识 316 12.2 理解阻塞 317 12.2.1 原子性 317 12.2.2 一致性 320 12.2.3 隔离性 320 12.2.4 持久性 321 12.3 数据库锁 321 12.3.1 锁粒度 322 12.3.2 锁升级 325 12.3.3 锁模式 326 12.3.4 锁兼容性 332 12.4 隔离级别 332 12.4.1 未提交读 333 12.4.2 已提交读 333 12.4.3 可重复读 335 12.4.4 可序列化(Serializable) 338 12.4.5 快照(Snapshot) 343 12.5 索引对锁的作用 343 12.5.1 非聚簇索引的作用 344 12.5.2 聚簇索引的作用 346 12.5.3 索引在可序列化隔离级别上的作用 346 12.6 捕捉阻塞信息 347 12.6.1 使用SQL捕捉阻塞信息 347 12.6.2 Profiler跟踪和被阻塞进程报告事件 349 12.7 阻塞解决方案 351 12.7.1 优化查询 352 12.7.2 降低隔离级别 352 12.7.3 分区争用的数据 353 12.7.4 争用数据上的覆盖索引 354 12.8 减少阻塞的建议 354 12.9 自动化侦测和收集阻塞信息 355 12.10 小结 359 第13章 死锁分析 360 13.1 死锁基础知识 360 13.2 使用错误处理来捕捉死锁 361 13.3 死锁分析 362 13.3.1 收集死锁信息 362 13.3.2 分析死锁 364 13.4 避免死锁 368 13.4.1 按照相同的时间顺序访问资源 368 13.4.2 减少被访问资源的数量 369 13.4.3 最小化锁的争用 369 13.5 小结 370 第14章 游标开销分析 372 14.1 游标基础知识 372 14.1.1 游标位置 373 14.1.2 游标并发性 374 14.1.3 游标类型 376 14.2 游标开销比较 378 14.2.1 游标位置的开销比较 378 14.2.2 游标并发性上的开销比较 380 14.2.3 在游标类型上的开销比较 381 14.3 默认结果集 383 14.3.1 好处 384 14.3.2 缺点 384 14.4 分析SQL Server游标开销 386 14.5 游标建议 390 14.6 小结 392 第15章 数据库工作负载优化 393 15.1 工作负载优化基础知识 393 15.2 工作负载优化步骤 394 15.3 捕捉工作负载 397 15.4 分析工作负载 399 15.5 识别开销最大的查询 400 15.6 确定开销最大的查询的基线资源使用 402 15.6.1 总体资源使用 402 15.6.2 详细资源使用 402 15.7 分析和优化外部因素 405 15.7.1 分析应用程序使用的批级别选项 405 15.7.2 分析统计有效性 406 15.7.3 分析碎片整理需求 406 15.8 分析开销最大的查询的内部行为 410 15.8.1 分析查询执行计划 410 15.8.2 识别执行计划中开销较大的步骤 412 15.8.3 分析处理策略的效率 412 15.9 优化代价最大的查询 412 15.9.1 修改现有索引 413 15.9.2 分析连接提示的应用 415 15.9.3 避免聚簇索引扫描操作 417 15.9.4 修改过程 418 15.10 分析对数据库工作负载的影响 420 15.11 迭代各个优化阶段 421 15.12 小结 424 第16章 SQL Server优化检查列表 425 16.1 数据库设计 425 16.1.1 平衡不足和过多的规范化 426 16.1.2 从实体完整性约束中得利 427 16.1.3 从域和参照完整性约束中得利 428 16.1.4 采用索引设计最佳实践 430 16.1.5 避免在存储过程名称中使用sp_前缀 431 16.1.6 最小化触发器的使用 431 16.2 查询设计 432 16.2.1 使用SET NOCOUNT ON命令 432 16.2.2 显式定义对象所有者 432 16.2.3 避免不可参数化的搜索条件 432 16.2.4 避免WHERE子句列上的算术运算符 433 16.2.5 避免优化器提示 434 16.2.6 远离嵌套视图 434 16.2.7 确保没有隐含的数据类型转换 435 16.2.8 最小化日志开销 435 16.2.9 采用重用执行计划的最佳实践 435 16.2.10 采用数据库事务最佳实践 436 16.2.11 消除或减少数据库游标开销 437 16.3 配置设置 437 16.3.1 Affinity Mask 437 16.3.2 内存配置选项 437 16.3.3 并行性开销阈值 438 16.3.4 最大并行度 438 16.3.5 优化即席工作负载 438 16.3.6 查询调控器开销限制 439 16.3.7 填充因子(%) 439 16.3.8 被阻塞过程阈值 439 16.3.9 数据库文件布局 439 16.3.10 数据库压缩 440 16.4 数据库管理 440 16.4.1 保持统计最新 440 16.4.2 保持最小数量的索引碎片数量 441 16.4.3 循环使用SQL错误日志文件 441 16.4.4 避免像AUTO_CLOSE或AUTO_SHRINK这样的自动化数据库功能 441 16.4.5 最小化SQL跟踪开销 442 16.5 数据库备份 442 16.5.1 增量和事务日志备份频率 442 16.5.2 备份分布 443 16.5.3 备份压缩 444 16.6 小结 444 作者介绍 作者:(美国)弗里奇(Grant Fritchey) (美国)达姆(Sajal Dam) 译者:姚军 弗里奇(Grant Fritchey),为FM Global(一家行业领先的工程和保险公司)工作,担任首席DBA。他使用各种语言(如VB、C#和Java等)开发了许多大规模的应用程序,从版本6.0开始使用SQL Server。他曾经为3家失败的.com公司担任财务和咨询工作,还是Dissecting SQL Server Execution Plans一书的作者。 达姆(Sajal Dam),拥有位于印度班加罗尔的印度理工学院的计算机科学技术硕士学位,并且使用微软技术超过16年。他已经在设计数据库应用和管理软件开发方面拥有了很广泛的背景。Saial还在从前端网页到后端数据库的基于微软技术的应用程序上,具备了故障定位和性能优化的大量经验。他有许多为《财富》500强公司设计可伸缩的数据库解决方案和最大化数据库环境性能的经验。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值