C++ STL之std::map:红黑树的魔法与性能测试

关注囧囧妹了解更多的编程知识

引言

最近在使用C++写代码,也是刚接触C++,恰巧碰到一个需要使用map的地方,不知道其查找元素的性能怎么样,所以研究了下,做个记录,目前从x86平台测试map查找一个元素大概需要2us,这里你需要考虑在自身硬件平台比如arm,做一些cpu加压情况下再查看map效率以评估map是否满足业务需求。

在C++编程的世界中,STL(标准模板库)一直以其强大的数据结构和算法而著称。其中,std::map是STL提供的一个关联容器,它的核心是红黑树(Red-Black Tree)数据结构。红黑树是一种自平衡的二叉查找树,以其出色的性能和平衡机制而备受推崇。

本文将深入探讨std::map以及其核心红黑树的原理,解释其关键特性,包括插入、查找和删除操作,以及有序性的优势。我们还将进行性能测试,以展示std::map在实际应用中的卓越性能。


红黑树,std::map的核心

std::map的核心数据结构是红黑树(Red-Black Tree)数据结构。红黑树是一种自平衡二叉查找树,它具有以下特性:

  • 每个节点是红色或黑色:每个节点都被标记为红色或黑色,这是红黑树的基本性质之一。

  • 根节点是黑色:树的根节点始终是黑色的。

  • 每个叶子节点(NIL节点,通常表示为黑色)都被认为是黑色的:NIL节点是树的末端节点,它们通常被表示为黑色。

  • 如果一个节点是红色的,那么它的子节点必须是黑色的:这一性质确保没有两个相邻的红色节点。

  • 从任何给定节点到其后代叶子节点的每条路径都包含相同数量的黑色节点:这个性质保证了树的平衡。

这些性质保证了红黑树的平衡性,使得树的高度保持相对较小,从而提供了高效的查找、插入和删除操作。


std::map常见操作

插入操作:保持平衡

当您向std::map插入新的键值对时,红黑树需要进行一系列旋转和着色操作,以保持树的平衡。这确保了即使在大规模数据集下,插入操作仍然高效。

// 插入操作示例std::map<int, std::string> myMap;myMap[42] = "Hello, World!";

在插入操作中,红黑树遵循一些规则,例如:

  • 新插入的节点通常是红色的。

  • 如果插入破坏了红黑树的性质,就需要执行旋转和着色操作来恢复平衡。

查找操作:速度与效率

std::map的查找操作非常高效,因为红黑树的结构使得它可以迅速定位到所需的节点。查找操作会从根节点开始,根据键值比较逐步沿树向下移动,直到找到目标节点或确定目标节点不在树中。这个过程的时间复杂度是O(log N),其中N是树中元素的数量。

// 查找操作示例auto result = myMap.find(42);if (result != myMap.end()) {    std::cout << "Found: " << result->second << std::endl;} else {    std::cout << "Not found!" << std.endl;}

删除操作:平衡的维护

删除操作也是相对复杂的,因为它需要保持树的平衡。当删除一个节点时,可能会引起树的不平衡,需要执行旋转和着色操作来修复它。这些操作确保了红黑树的性质仍然得以维持。

// 删除操作示例myMap.erase(42);

在删除操作中,红黑树也遵循一系列规则,包括:

  • 如果删除的节点是红色的,可能不会破坏树的性质。

  • 如果删除的节点是黑色的,就可能会引发平衡问题,需要执行一系列的操作来修复。

有序性:按键排序

std::map中的元素是按键值有序排列的,这意味着您可以使用迭代器来遍历元素,或者进行范围查找。

// 使用迭代器遍历示例for (const auto& pair : myMap) {    std::cout << "Key: " << pair.first << ", Value: " << pair.second << std::endl;}

性能测试:查找操作

下面是一个性能测试示例,因为我对查找某个元素的性能是有要求的,所以做了一个简单测试:

#include <iostream>
#include <map>
#include <random>
#include <chrono>

int main() {
    std::map<int, int> testMap;
    std::random_device rd;
    std::mt19937 gen(rd());
    std::uniform_int_distribution<int> dist(1, 1000000);

    // 插入100,000个随机键值对
    for (int i = 0; i < 100000; ++i) {
        int key = dist(gen);
        int value = i;
        testMap[key] = value;
    }

    // 测试查找操作的效率
    int totalIterations = 100000;
    int foundCount = 0;
    std::chrono::high_resolution_clock::time_point start = std::chrono::high_resolution_clock::now();

    for (int i = 0; i < totalIterations; ++i) {
        int key = dist(gen);
        if (testMap.find(key) != testMap.end()) {
            foundCount++;
        }
    }

    std::chrono::high_resolution_clock::time_point end = std::chrono::high_resolution_clock::now();
    std::chrono::duration<double> duration = std::chrono::duration_cast<std::chrono::duration<double>>(end - start);

    std::cout << "查找 " << totalIterations << " 个元素所用时间: " << duration.count() << " 秒" << std::endl;
    std::cout << "找到 " << foundCount << " 个元素" << std::endl;
    std::cout << "查找单个元素耗时: " << (duration.count()*1000000) / totalIterations << " 微秒" << std::endl;

    return 0;
}

我们首先插入了100,000个随机键值对,然后执行查找操作,并记录查找到的元素数量,并计算时间。

使用g++编译执行结果:

图片

总结

std::map是C++编程中的神奇工具,它提供高效的查找、插入和删除操作,并按键排序数据。红黑树的自平衡性确保了它在各种操作下都能保持高效性。无论是实现关键功能还是性能测试,std::map都展现了其出色之处,使其成为处理大规模数据集的理想之选。

关注囧囧妹公众号,探索更多有关Linux、技术和编程的精彩内容!

欢迎留言分享你对命令行工具的使用经验和想法。如果你有任何问题,也可以在评论区提问,我会尽力为你解答。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

影帝sunny

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值