在做开发过程中,性能与质量问题是必须一致考虑的,而数据库的优化则是首当其冲的
1、表设计
根据业务的不同而设计不同的表格,
A、当为了获取某些列信息而需要进行多表查询,而且数据量庞大的时候,在多个表中重复列能够提升性能,再通过触发器维护列信息一致即可
B、有些表中的数据部分是频繁使用,而部分是非频繁使用,可以进行纵向分区,将一个表分成多个表,当大数据量的时候,也可以进行横向表分区,将历史数据放入到其他表中,保持数据量小,轻便快捷
2、硬件平台选择
这是数据库工程师的事情
3、查询优化
主要是索引的选择,查询分析、索引选择、合并选择
首先利用工具进行查询分析,分析出可优化的部分
对于常更新的列不要建立索引,否则会严重影响性能,因为频繁的索引重建会导致性能降低
查询条件尽量加索引
法则:不要在建立的索引的数据列上进行下列操作:
◆避免对索引字段进行计算操作
◆避免在索引字段上使用not,<>,!=
◆避免在索引列上使用IS NULL和IS NOT NULL
◆避免在索引列上出现数据类型转换
◆避免在索引字段上使用函数
◆避免建立索引的列中使用空值。
4、SQL优化
1.如果有独特的索引,那么带有“=”操作符的WHERE子句性能最好,其次是封闭的区间(范围),再其次是开放的区间。
2.从数据库访问的角度看,含有不连续连接词(OR和IN)的WHERE子句一般来说性能不会太好。
3.包含NOT、<>、或! =的WHERE子句对于优化器的索引选择来说没有什么用处。因为这样的子句是排斥性的,而不是包括性的,所以在扫描整个原来数据表之前无法确定子句的选择性。
4.限制数据转换和串操作,优化器一般不会根据WHERE子句中的表达式和数据转换式生成索引选择。例如:
paycheck * 12>36000 or substring(lastname,1,1)=“L”
如果该表建立了针对paycheck和lastname的索引,就不能利用索引进行优化,可以改写上面的条件表达式为:
paycheck<36000/12 or lastname like “L%”
5.查询的模糊匹配
尽量避免在一个复杂查询里面使用 LIKE '%parm1%'—— 红色标识位置的百分号会导致相关列的索引无法使用,最好不要用.
解决办法:
其实只需要对该脚本略做改进,查询速度便会提高近百倍。改进方法如下:
a、修改前台程序——把查询条件的供应商名称一栏由原来的文本输入改为下拉列表,用户模糊输入供应商名称时,直接在前台就帮忙定位到具体的供应商,这样在调用后台程序时,这列就可以直接用等于来关联了。
b、直接修改后台——根据输入条件,先查出符合条件的供应商,并把相关记录保存在一个临时表里头,然后再用临时表去做复杂关联
6、where语句中,尽量避免对索引字段进行计算操作
7、不要以字符串格式申明数值类型
8、避免在WHERE子句中使用in,not in,or 或者having
5、其他优化
数据与日志文件分开在不同磁盘存储
tempdb存储在单独的磁盘
清理删除日志