map/unordered_map原理和使用整理

最新推荐文章于 2024-04-09 10:30:49 发布

StephenZou14

最新推荐文章于 2024-04-09 10:30:49 发布

阅读量2.4k

点赞数 1

分类专栏： C/C++ 文章标签： hash

C/C++ 专栏收录该内容

23 篇文章 0 订阅

订阅专栏

结论

新版的hash_map都是unordered_map了，这里只说unordered_map和map.

运行效率方面：unordered_map最高，而map效率较低但提供了稳定效率和有序的序列。

占用内存方面：map内存占用略低，unordered_map内存占用略高,而且是线性成比例的。

需要无序容器，快速查找删除，不担心略高的内存时用unordered_map；有序容器稳定查找删除效率，内存很在意时候用map。

原理

map的内部实现是二叉平衡树(红黑树)；hash_map内部是一个hash_table一般是由一个大vector，vector元素节点可挂接链表来解决冲突来实现.

这里写图片描述

hash_map其插入过程是：

得到key
通过hash函数得到hash值
得到桶号(一般都为hash值对桶数求模)
存放key和value在桶内。

其取值过程是:

得到key
通过hash函数得到hash值
得到桶号(一般都为hash值对桶数求模)
比较桶的内部元素是否与key相等，若都不相等，则没有找到。
取出相等的记录的value。

hash_map中直接地址用hash函数生成，解决冲突，用比较函数解决。

性能特点

非频繁的查询用map比较稳定；频繁的查询用hash_map效率会高一些，c++11中的unordered_map查询效率会更高一些但是内存占用比hash_map稍微大点。unordered_map 就是 boost 里面的 hash_map 实现。

其实，stl::map对于与java中的TreeMap，而boost::unordered_map对应于java中的HashMap。python中的map就是hashmap实现的，所以查询效率会比C++的map查询快。(java,python官方版的虚拟机都是用C语言实现的，所以内部的思想和方法都是通用的。)

若考虑有序，查询速度稳定，容器元素量少于1000,非频繁查询那么考虑使用map。

若非常高频查询(100个元素以上，unordered_map都会比map快)，内部元素可非有序，数据大超过1k甚至几十万上百万时候就要考虑使用unordered_map(元素上千万上亿时4GB的内存就要担心内存不足了,需要数据库存储过程挪动到磁盘中)。

hash_map相比unordered_map就是千万级别以上内存占用少15MB,上亿时候内存占用少300MB，百万以下都是unordered_map占用内存少，
且unordered_map插入删除相比hash_map都快一倍，查找效率相比hash_map差不多，或者只快了一点约1/50到1/100。
综合非有序或者要求稳定用map，都应该使用unordered_map,set类型也是类似的。

unordered_map 查找效率快五倍，插入更快，节省一定内存。如果没有必要排序的话，尽量使用 hash_map(unordered_map 就是 boost 里面的 hash_map 实现)

使用unordered_map

unordered_map需要重载hash_value函数，并重载operator ==运算符。

参考链接：STL map与Boost unordered_map

使用Hash_map需要注意的问题

/*
 *\author peakflys
 *\brief 演示hash_map键值更改造成的问题
 */
#include <iostream>
#include <ext/hash_map>

struct Unit
{
    char name[32];
    unsigned int score;
    Unit(const char *_name,const unsigned int _score) : score(_score)
    {   
        strncpy(name,_name,32);
    }   
};
int main()
{
    typedef __gnu_cxx::hash_map<char*,Unit*> uHMap;
    typedef uHMap::value_type hmType;
    typedef uHMap::iterator hmIter;

    uHMap hMap;
    Unit *unit1 = new Unit("peak",100);
    Unit *unit2 = new Unit("Joey",20);
    Unit *unit3 = new Unit("Rachel",40);

    hMap[unit1->name] = unit1;
    hMap[unit2->name] = unit2;

    hMap.insert(hmType(unit3->name,unit3));
    hMap.insert(hmType(unit4->name,unit4));
    for(hmIter it=hMap.begin();it!=hMap.end();++it)
    {   
        std::cout<<it->first<<"\t"<<it->second->score<<std::endl;//正常操作
    }  

    for(hmIter it=hMap.begin();it!=hMap.end();++it)
    {
        Unit *unit = it->second;
        //hMap.erase(it++);
        delete unit; 
        //delete释放节点内存，但是hMap没有除去,造成hMap内部错乱，有可能宕机
    } 

    hmIter it = hMap.begin();
    strncpy(it->first,"cc",32);//强行更改

    for(hmIter it=hMap.begin();it!=hMap.end();++it)
    {   
        std::cout<<it->first<<"\t"<<it->second->score<<std::endl;
        //死循环，原因参加上面++操作说明
        /*operator++ 操作是从_M_cur开始，优先_M_cur->_M_next，为空时遍历vector直至找到一个_M_cur不为空的节点，遍历vector 时需要取它对应的桶位置(参砍上面hash_map取值过程)，_M_bkt_num_key(key)中key的值是修改后的值，假如你改的键值，通过 此函数得到的桶位置在你当前元素之前，这样就造成了死循环.
        */
    }   
    return 0;
}

参考链接：

map hash_map unordered_map 性能测试
 Linux下map hash_map和unordered_map效率比较
 关于hash_map的一点感悟
 C++ STL之哈希表 | unordered_map

StephenZou14

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
map/unordered_map原理和使用整理

结论新版的hash_map都是unordered_map了，这里只说unordered_map和map.运行效率方面：unordered_map最高，而map效率较低但提供了稳定效率和有序的序列。占用内存方面：map内存占用略低，unordered_map内存占用略高,而且是线性成比例的。需要无序容器，快速查找删除，不担心略高的内存时用unordered_map；有序容器稳定查找删除效率，内存很在
复制链接

扫一扫