什么是索引?
索引就是数据结构,改数据结构保存了这张表中的某一列的所有值,就是基于数据库表中的某一列所创建的,一个索引是由某一列上的数据组成,并且这些数据存储在某个数据结构中
索引的好处?
简单来说就是提高查询效率
索引的设计原则?
设计索引的时候,尽量满足以下原则,便于提高使用效率,更高效的使用索引
搜索的索引列是,不一定是所要选择的列,换句话说,最适合索引的列是出现在WHERE字句中的列,或者连接字句中指定的列,而不是出现在SELECT关键字后的选择列表中的列
使用唯一索引,索引列的基数越大,索引的效果越好,说白了就是通过这列值能更好的区分每一行的值
使用短索引,如果对字符串列进行索引,应该指定一个前缀的长度,假如有一列字符串是200个字节的长度,对前10个或者20个字符进行索引,多数值是唯一的,那么就不要对整个列进行索引,对前10个或者20个字符进行索引能够节省大量的索引空间,也可能会使得查询效率更高,并且较小的索引所需的磁盘IO较小,较短的值比较起来更快,最重要的是,索引高速缓存中,可以容纳更多的键值
不要过度索引,如果在修改表的内容的时候,索引必须进行更新,因此索引越多,所花费的时间就越长,如果一个索引很少使用,那么会不必要的减缓表的修改速度
常见的两种索引:
HASH索引:将列值作为hash表的key,而value中保存是表当中对应的行的指针,hash表就是一个关联数组,缺点是无序的数据结构,只适用于键值对的查询,既就是等值查询(=,<=>操作符的等式表),效率一般
BTREE索引:数据存储是有序的,时间效率较高(可适应于> < >= <= != between或者<>)
小结:索引用于快速找出在某个列中有一特定值的行,如果不适用索引,mysql必须从第一行记录开始然后读完整个表直到找出相关的行,表越大,话费的时间越大,如果表中查询的列有一个索引,mysql能快速找到一个位置去搜索数据文件的中间,没必要查看所有的数据,如果一个表有1000行,比顺序读取快100倍,注意如果需要访问大部分行,顺序读取要快得多,此时应该避免磁盘搜索