1.C++ 中vector和数组的区别
内存中的位置不同
- C++中数组为内置的数据类型,存放在栈中,其内存的分配和释放完全由系统自动完成;而vector存放在堆中,由STL库中程序负责内存的分配和释放。
大小能否变化:
- 虽然数组也可以不指定长度,但是长度一旦指定就固定不变;而vector可以通过插入删除等操作改变长度的大小,当vector中空间不足时,会在原来的基础上两倍申请内存进行扩容。
初始化和赋值:
- 数组不能通过拷贝另一个数组的内容来初始化,也不能通用数组为其他数组赋值,而向量可以。
效率:
- 数组的效率 > vector,主要原因是vector的扩容过程要消耗大量的时间。
2.vector和list的区别
存取
- vector在内存空间是连续的,可以直接用下标访问,所以随机存取的复杂度为O(1);
- list在内存空间上不连续,只能通过指针访问,所以存取效率比较低。
插入和删除
- vector因为内存空间连续,所以插入和删除元素时会造成修改位置之后所有元素的内存变化,所以插入和删除的效率较低,复杂度为O(n);
- list通过指针访问,所以只需修改个别指针,删除效率较高。
内存分配
- vector每次内存不够时都是两倍申请内存(将原本内存的数据拷贝到新内存再将原内存释放),当原本内存空间较大时再申请两倍内存可能会造成内存浪费。
- list每次只申请一个节点的内存,不会造成空间浪费。
总结:
如果只考虑高效的存取,而不考虑插入删除的效率,使用vector
如果需要大量进行插入删除操作而很少进行存取,使用list
如果既需要随机存取也需要考虑插入删除的效率,可以使用双向链表deque(支持收尾两端同时进行插入和删除,同时支持下标操作)
2.set和map
( 插入效率不是很高,但是查找效率非常快,直接按key查找。)
- set(或multi_set)和map(或multi_map)的底层数据结构:红黑树
- unordered_map、unordered_multimap、unordered_set、unordered_multiset的底层结构:hashtable
3.Hashtable(散列表)
应用场景:当需要存放这样一组数据,数据的取值范围很大[0,R),但是数据本身的数量N并不是很大时,hashtable是一种很好的选择。
Hashtable中的bucket数量M(即散列表的长度)的选择方法:选择质数且
R >> M > N
元素E在散列表中的映射地址(即对应的bucket的位置)为hash(E.key).
散列函数的设计方法:
- 除余法
缺点:除余法虽然一定程度上可以保证词条的均匀分布,但是依然残留有一定的连续性。比如相邻的key所对应的散列地址 哪个是彼此相邻;极小的关键码通常被集中映射到散列表的起始区段。(M=17)
- MAD(multiply-add-divide method)法
除余法的改进,选取合适的a,b可以很好地克服除余法原有的连续性缺陷。
Hash表解决冲突的办法
- 开放地址法:线性试探、平方试探(第i次试探的位置为 )
- 公共溢出区法:将冲突的元素放入一个公共的缓冲池
- 独立链表法:hashtable每个bucket为一个链表
优点:可以灵活地调整空间容量,空间使用效率较高
缺点:访问时需要遍历整个链表
- 再散列:用多个散列函数
重散列时bucket数 M' 的选择: M' 为离 2*M 最近的质数。