这段时间一直在面试,问了很多候选人数据库索引相关的知识,能答好的不是很多,令人惋惜啊,我也想留你啊……
面试官:了解过数据库索引吗?
候选人:听过一些,底层数据结构好像是二叉树,不对,好像是 B 树,哦,我想起来了,好像是 B+树……(像极了当年面试的我)
面试官:听过哈希索引吗?
候选人:我知道哈希表,哈希索引没听过
面试官:今天面试先到这里了,回去等消息吧……
先引入一个简单的示例,通过示例操作解释一下为什么需要数据库索引。
假设我们有一个名为 t_employee 的数据库表,这个数据库表有三列:name,age,address,数据量有上万行。
如果我们想要查找所有名为「leixiaoshuai」员工的详细信息,只需要写一个简单的 SQL 语句就可以搞定,相信大家都会写。
SELECT * FROM t_employee
WHERE name = 'leixiaoshuai'
如果没有索引,会发生什么?
CREATE INDEX age_address_index
ON t_employee (age, address)
可以把数据库索引类比成什么?
一个非常好的类比是把数据库索引看作是书的索引。
你从头到尾逐字逐行读完就是「全表扫描」;
你翻看目录挑选感兴趣的部分阅读就是走了索引。
使用数据库索引有什么代价?
既然索引优点这么多,那给所有列加上索引不就完事了,no no no,加索引是有代价的。
(1)索引会占用空间。你的表越大,索引占用的空间越大。
(2)在更新操作有性能损失。当你在表中添加、删除或者更新行数据的时候, 在索引中也会有相同的操作。
基本原则是:如果表中某列在查询过程中使用的非常频繁,那就在该列上创建索引。