数据库索引的底层原理B+Tree
假设我们有一张表如下:
CREATE TABLE `t_user` (
`ID` int(11) NOT NULL AUTO_INCREMENT PRIMARY KEY ,
`username` varchar(3) COLLATE utf8mb4_unicode_ci NOT NULL,
`sex` varchar(1) COLLATE utf8mb4_unicode_ci NOT NULL
)
插入数据
INSERT INTO t_user (ID, username, sex) VALUES ('1', '张3丰', 'M');
INSERT INTO t_user (ID, username, sex) VALUES ('5', '张4丰', 'M');
INSERT INTO t_user (ID, username, sex) VALUES ('7', '张4丰', 'M');
INSERT INTO t_user (ID, username, sex) VALUES ('9', '张3丰', 'M');
INSERT INTO t_user (ID, username, sex) VALUES ('2', '张a丰', 'F');
INSERT INTO t_user (ID, username, sex) VALUES ('6', '张b丰', 'M');
INSERT INTO t_user (ID, username, sex) VALUES ('4', '张c丰', 'M');
INSERT INTO t_user (ID, username, sex) VALUES ('8', '张d丰', 'M');
INSERT INTO t_user (ID, username, sex) VALUES ('3', '张e丰', 'F');
INSERT INTO t_user (ID, username, sex) VALUES ('10', '张7丰', 'M');
然后我们会得到按顺序排序好的列表
ID username sex
1 张3丰 M
2 张a丰 F
3 张e丰 F
4 张c丰 M
5 张4丰 M
6 张b丰 M
7 张4丰 M
8 张d丰 M
9 张3丰 M
10 张7丰 M
原来数据库已经帮我排序好了
链表查询的时间复杂度为O(n),如果数据有1000w条,那么我们运气好查1次就可以查到,如果运气不好那就需要1000w次(太惨了)。
下面使用B+Terr存储
当上面的树三层时能存储当前表的数据条数,每页16KB,每条数据大小(ID为int类型,username 为varchar(3) ,sex为varchar(1) ,P指针取最大值,假设username 全部都写到3个字符,那么数据大小 = 4 + 3 + 1 +8 = 16B)16B,第一层存储数据条数(16X1024/16 = 1024)1024条,第二层存储数据条数(16X1024/12X1024 = 1,398,101 )1,398,101条。
层数越多,调用io次数越多。