在硕士期间,同学去参加了国内某B2C的公司的面试,回来的时候,很郁闷的跟我说,面试官问了他一个数据库的问题,在一个查询中,使用了某个索引所施加的列作为过滤条件(例如:select a,b from t where c=x,其中C是表t的一个字段,该字段上建立了索引),当数据库使用该索引时,速度比不使用时反而降低了,请问为啥?结果那哥们很郁闷的说:不知道。
其实,就我个人看来,这个问题应该很简单的,主要是很多人在开发数据库的过程中,其实认为数据库是个黑匣子,而且没有相关的DBA做支持,没有去探究原理新的东西,所以,一旦遇见这种理论和实际经验相结合的问题。
在数据库中,访问数据的方式,从本质上来说是两种:一种是随机读取,也就是根据数据在磁盘上的位置,读取某一小部分数据,形象的说,就是小鸡在地上啄米;另外一种就是顺序读取了,就是将一个表所在的数据文件从头读到尾,很像是推土机挖矿一样。前者一般适合少量数据的读取,后者是适合大量数据的读取。
在数据库中,对于面试官所提的sql,实际的查询计划有两种:一种是,先读取索引中的满足条件的列所在的磁盘物理位置,然后去根据物理位置,将所在的列读