SELECT * FROM customers WHERE age > 25;
首先是普通的select,如果没有建立任何的索引的话,假设数据量为N,那么时间复杂度为O(N)
如果对age添加了索引,那么复杂度为O(log n)
假设使用了in操作,总共查找M种,不考虑mysql要做的一些优化只有索引,时间复杂度为O(M log(N)),
exists查找方式则是和in反过来的,只有索引的情况下O(N log(M))
无索引的情况下都是O(NM)
SELECT * FROM customers JOIN orders ON customers.customer_id = orders.customer_id;
如果customers和orders都没有索引的话,一个数据量为N,一个数据量为M,那么总的时间复杂度为O(NM),假设M有索引的话,时间复杂度为O(N logM),两个都有索引的时间复杂度为O(N+M)索引的值本身都是有序的,所以可以直接通过类似于双指针的形式对两个表都进行扫描。并且上述复杂度都是在customer_id字段为唯一索引的情况下,如果customer_id重复度都比较的高,那么组合排列数就为NM,时间复杂度肯定也就是O(NM)。如果调用次数比较多的话,可以选择将两张表直接合成一张表。时间和空间上都更加的优
具体的底层优化还没有考虑,所以会有一定的错误