区别:
红黑树是有序的,Hash是无序的,根据需求来选择。
红黑树占用的内存更小(仅需要为其存在的节点分配内存),而Hash事先就应该分配足够的内存存储散列表(即使有些槽可能遭弃用)。
**平衡二叉树、b树、红黑树查找和删除的时间复杂度都是O(logn),
Hash查找和删除的时间复杂度都是O(1)。**
n个节点的平衡二叉树时间复杂度logn,其高度H=logn:
推导:n是n个节点,
高度为0的最少1个结点。
高度为1的的最少是2个结点。
而高度为h的最少是f(h-1)+f(h-2)+1个节点m。
所以m=1+2+4+8+…+2^(h-1)+1
n-m=k;;k是最后一层的节点个数-1;是个常数
通过差分方程可以解得f的表达式是关于高度的指数,所以m个结点的高度就是log(m);
近似n个结点的高度就是log(n);
关于哈希表的速度:
hash查找速度会比RB树快,而且查找速度基本和数据量大小无关,属于常数级别;而RB树的查找速度是log(n)级别。并不一定常数就比log(n) 小,因为hash还有hash函数的耗时。当元素达到一定数量级时,考虑hash。但若你对内存使用特别严格, 希望程序尽可能少消耗内存,那么hash可能会让你陷入尴尬,特别是当你的hash对象特别多时,你就更无法控制了,而且 hash的构造速度较慢。
哈希应用领域:
哈希是无序的,快速查找,删除的基本数据结构,通常需要总数据量可以放入内存。因为哈希表是键值映射。但是如果数据量过大,考虑将数据分成若干小文件,再放内存处理。
红黑树和B树应用场景有何不同?
2者都是有序数据结构,可用作数据容器。红黑树多用在内部排序,即全放在内存中的,微软STL的map和set的内部实现就是红黑树。B树多用在内存里放不下,大部分数据存储在外存上时。因为B树层数少,因此可以确保每次操作,读取磁盘的次数尽可能的少。
红黑树:在数据较小,可以完全放到内存中时,红黑树的时间复杂度比B树低。
B树:数据量较大,外存中占主要部分时,B树因其读磁盘次数少,而具有更快的速度。