整理自网络上的各种来源,仅做个人记录!
文章目录
1、map和unordered_map的区别
map:map内部实现是红黑树,具有自动排序的功能,因此map内部元素都是有序的,红黑树的每一个节点都代表着map的一个元素。map的查询、插入、删除操作的时间复杂度都是O(logn)。
unordered_map:unordered_map内部实现是哈希表(也叫散列表,通过把关键码值映射到Hash表中一个位置来访问记录,查找的时间复杂度可达到O(1))。因此,其元素的排列顺序是无序的。
2、红黑树与平衡二叉树
红黑树是一种是一种不严格的平衡二叉查找树,是“近似平衡”的。
1、红黑树放弃了追求完全平衡,追求近似平衡,在与平衡二叉树的时间复杂度相差不大的情况下,保证每次插入最多只需要三次旋转就能达到平衡,实现起来也更为简单。红黑树的高度近似 log2n,插入、删除、查找操作的时间复杂度都是 O(logn)。
2、平衡二叉树追求绝对平衡,条件比较苛刻,实现起来比较麻烦,每次插入新节点之后需要旋转的次数不能预知。
3、哈希原理
散列函数:
散列函数计算得到的散列值是一个非负整数;
如果 key1 = key2,那 hash(key1) == hash(key2);
如果 key1 ≠ key2,那 hash(key1) ≠ hash(key2)。
散列冲突解决方法:
-
开放寻址法:线性探测,二次探测,双重散列
线性探测:往散列表中插入数据时,如果某个数据经过散列函数散列之后,存储位置已经被占用了,我们就从当前位置开始,依次往后查找,看是否有空闲位置,直到找到为止。
我们可以将删除的元素,特殊标记为 deleted。当线性探测查找的时候,遇到标记为 deleted 的空间,并不是停下来,而是继续往下探测。 -
链表法(链表可以使用红黑树或者跳表进行优化)
4、哈希开链过长如何解决?
使用红黑树或者跳表这样的数据结构(同上)
5、有了哈希表,为什么还需要红黑树?
第一,散列表中的数据是无序存储的,如果要输出有序的数据,需要先进行排序。而对于红黑树来说,只需要中序遍历,就可以在 O(n) 的时间复杂度内,输出有序的数据序列。
第二,散列表扩容耗时很多,而且当遇到散列冲突时,性能不稳定,尽管二叉查找树的性能不稳定,但是在工程中,我们最常用的平衡二叉查找树的性能非常稳定,时间复杂度稳定在 O(logn)。
第三,尽管散列表的查找等操作的时间复杂度是常量级的,但因为哈希冲突的存在,这个常量不一定比 logn 小,所以实际的查找速度可能不一定比 O(logn) 快。加上哈希函数的耗时,也不一定就比平衡二叉查找树的效率高。
第四,散列表的构造比二叉查找树要复杂,需要考虑的东西很多。比如散列函数的设计、冲突解决办法、扩容、缩容等。平衡二叉查找树只需要考虑平衡性这一个问题,而且这个问题的解决方案比较成熟、固定。
6、多个有序链表合并
考虑分治法,每两个链表进行合并
类似归并的思路
7、百度搜索字符串absd,如何快速显示出后续的字符串
字典树的应用
扩展:如果搜索的字符串在匹配字符串中间,也需要作为结果输出,怎么办?
ac自动机?