最近开始学习王争老师的《数据结构与算法之美》,通过总结再加上自己的思考的形式记录这门课程,文章主要作为学习历程的记录。
课前问题:假设有1000万个整数数据,每个数据占8个字节,如何设计数据结构与算法,快速判断某个整数是否出现在这1000万数据中,同时又希望这个功能内存不要超过100M?
这个问题就引入了二分查找,举个例子来理解二分查找:假设一个数组为0-99,要查找元素23在数组中的位置
次数 | 猜测范围 | 中间数 | 对比大小 |
---|---|---|---|
1 | 0-99 | 49 | 49>23 |
2 | 0-48 | 24 | 24>23 |
3 | 0-23 | 11 | 11<23 |
4 | 12-23 | 17 | 17<23 |
5 | 18-23 | 20 | 20<23 |
6 | 21-23 | 22 | 22<23 |
7 | 23 | √ |
利用二分思想,每次都与区间中间数据比对大小,缩小查找区间的范围,二分查找针对的是一个有序的数据集合,查找思想有点类似分治思想,每次都通过跟区间的中间元素对比,将待查找的区间缩小为原来的一半,直到找到要查找的元素,或者区间被缩小为0。
二分查找查找效率非常高。假设数据大小为n,每次查找后数据都会缩小为原来的一半,也就是会除以2,最坏的情况下,直到查找区间被缩小为空才停止。
被查找区间的大小变化:
n n n , n / 2 n/2