MySQL优化经验
- 为查询缓存优化你的查询
- EXPLAIN 你的 SELECT 查询
- 当只要一行数据时使用 LIMIT 1
- 为搜索字段建索引
- 在Join表的时候使用相当类型的例,并将其索引千万不要 ORDER BY RAND()
- 避免 SELECT *
- 永远为每张表设置一个ID,使用数字自增
- 使用 ENUM 而不是 VARCHAR
- 从 PROCEDURE ANALYSE()取得建议
- 尽可能的使用 NOT NULL
- Prepared Statements很像存储过程,是一种运行在后台的SOL语句集合,我们可以从使用 prepared statements 获得很多好处,无论是性能问题还是安全问题无缓冲的查询
- 把IP地址存成 UNSIGNED INT
- 固定长度的表会更快
- 垂直分割
- 拆分大的 DELETE 或 INSERT 语句
- 越小的列会越快
- 选择正确的存储引擎
- MyISAM 适合于一些需要大量查询的应用,但其对于有大量写操作并不是很好。甚至你只是需要update一个字段,整个表都会被锁起来,而别的进程,就算是读进程都无法操作直到读操作完成。另外,
- MyISAM 对于 SELECT COUNT(*) 这类的计算是超快无比的。InnoDB 的趋势会是一个非常复杂的存储引擎,对于一些小的应用,它会比 MyISAM 还慢。他是它支持“行锁”,于是在写操作比较多的对候,会更优秀。并且,他还支持更多的高级应用,比如:事
- 使用一个对象关系映射器 (Object Relational Mapper)
- 小心“永久链接”
- “永久链接”的目的是用来减少重新创建MVSOL链接的次数。当一个链接被创建了,它会永远处在连接的状态,就算是数据库操作已经结束了。而且,自从我们的Apache开始重用它的子进程后--也就是说,下一次的HTTP请求会重用Apache的子进程,并重用相同的 MySQL 链接
mysql语句优化
- 对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引
- 应尽量避免在 where 子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描。
- 应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如: select id from t where num is null
- 可以在num上设置默认值0,佣保表中num列没有null值,然后这样查询:
select id from t where num=0 - 应尽量避免在 where 子句中使用 or 连接条件,否则将导致引警放弃使用索引而进行全表扫描如:
- select id from t where mum=1 or num=20
- 可以这样查询:
- select id from t where nun=10
- union all
- select id from t where num=20
- 下面的查询也将导致全表扫描
- select id from t where nane like `%abc%`
- 若要提高效率,可以考虑全文检索。
- in 和 not in 也要慎用,否则会导致全表扫描,如:
- select id from t where mum in(1,2,3)
- 对于连续的鼓值,能用 between 就不要用 in 了:
- select id from t where num between 1 and 3
- 如果在 where 子句中使用参数,也会导致全表扫描。因为SQL只有在运行时才会解析局部变量,但优化程序不能将访问计划的选择推迟到运行时;它必须在编译时进行选择。然而,如果在编译时建立访问计划,变量的值还是未知的,因而无法作为索引选择的输入项。如下面语句将进行全表扫描:
- select id from t where nun=enum
- 可以改为强制查询使用索引:
- select id from t with(index(索引名)) where num=@num
- 应尽量避免在 where 子中对字段进行表达式操作,这将导致引攀放弃使用索引而进行全表扫描。如:
- select id from t where num/2=100
- 应改为:
- select id from t where num=100*2
- 应尽量避免在where子句中对字段进行函数操作,这将导致引擎放弃使用索引而进行全表扫描,如:
- select id from t where substring(name,1,3)='abc' --name以abc开头的id
- select id from t where datediff(day,createdate,"2005-11-30")=0 --"2005-11-38'生的id
- 应改为:
- select id from t where nane like 'abc%'
- select id from t where createdate>='2805-11-30' and createdate<'2805-12-1'
- 不要在 where 子句中的“=”左边进行函数、算术运算或其他表达式运算,否则系统将可能无法正确使用索引。
- 在使用索引字段作为条件时,如果该索引是复合索引,那么必须使用到该索引中的第一个字段作为条件时才能保证系统使用该索引,否则该索引将不会被使用,并且应尽可能的让字段顺序与索引顺序相一致
- 不要写一些没有意义的查询,如需要生成一个空表结构:
- select col1,col2 into ft from t where 1=0
- 这类代码不会返回任何结果集,但是会泪耗系统资源的,应改成这样:
- create table ft(...)
- 很多时娱用 exists 代替 in 是一个好的选择:
- select num from a where num in(select rum from b)
- 用下面的语句替换:
- select num from a where exists(select 1 from b where num=a.num)
- 并不是所有索引对查询都有效,SOL是根据表中数据来进行查询忧化的,当索引列有大量数据重加时,SOL查询可能不会去利用索引,如一表中有字段sex,male、female几平各一半,那么即使在sex上建了索引也对查询效率起不了作用。
- 索引并不是越多越好,索引固然可以提高相应的 select 的效率,但同时也降低了 insert 及update 的效率,因为 nsert 或 update 时有可能会重建索引,所以怎样建索引需要情重考虑,视具体情况而定。一个表的索引数最好不要超过6个,若太多则应考虑一些不常使用到的列上建的索引是否有必要。
- 应尽可能的避免更新 clustered 索引数据列,因为 clustered 泰引数据列的顺序就是表记录的物理存储顺序,一旦该列值改变将导致整个表记录的顺序的调整,会耗费相当大的资源。若应用系统需要频紫更新 clustered 索引数据列,那么需要考虑是否应将该索引建为 clustered 索引。
- 尽量使用数字型字段,若只含数值信息的字段尽量不要设计为字符型,这会降低查询和连接的性能,并会增加存储开销。这是因为引攀在处理查询和连接时会逐个比较字符审中每一个字符,而对于数字型而言只需要比较一次就够了。
- 尽可能的使用 varchar/nvarchar 代替 char/nchar ,因为首先变长字段存储空间小,可以节省存储空间,其次对于查询来说,在一个相对较小的字段内搜索效率显然要高些。
- 任何地方都不要使用 select * fram t ,用具体的字段列表代替“”,不要返回用不到的任何字段。
- 尽量使用表变量来代替临时表。如果表变量包含大量数据,请注意索引非常有限(只有主键索引)
- 避免频繁创建和删除临时表,以减少系统表资源的消耗
- 临时表并不是不可使用,适当地使用它们可以使某些例程更有效,例如,当需要重复引用大型表或常用表中的某个致据集时。但是,对于一次性事件,最好使用导出表。
- 在新建临时表时,如果一次性插入数据量很大,那么可以使用 select into 代 create table,避免造成大量 log ,以提高速度,如果数据量不大,为了缓和系统表的资源,应先create table,然后insert
- 如果使用到了临时表,在存储过程的最后务必将所有的临时表显式删除,先 truncate table,然后 drop table ,这样可以避免系统表的较长时间锁定
- 尽量避免使用游标,因为游标的效率较差,如果游标操作的数据超过1万行,那么就应该考虑改写
- 使用基于游标的方法或临时表方法之前,应先寻找基于集的解决方案来解决问题,基于集的方法通常更有效
- 与临时表一样,游标并不是不可使用。对小型数据集使用 FAST_FORWARD 游标通常要优于其他逐行处理方法,尤其是在必须引用几个表才能获得所需的数据时。在结果集中包括“合计”的例程通常要比使用游标执行的速度快。如果开发时间允许,基于游标的方法和基于集的方法都可以尝试一下,看哪一种方法的效果更好。
- 在所有的存储过程和触发器的开始处设置 SET NOCOUNT ON ,在结束时设置 SET NOCOUNT OFF。无需在执行存储过程和触发器的每个语句后向客户端发送 DONE_IN PROC 消息
- 尽量避免向客户端返回大数据量,若数据量过大,应该考虑相皮需求是否合理
- 尽量避免大事务操作,提高系统并发能力