【C++】迭代器失效问题解析


Blog’s 主页: 白乐天_ξ( ✿>◡❛)
🌈 个人Motto:他强任他强,清风拂山冈!
🔥 所属专栏:C++深入学习笔记
💫 欢迎来到我的学习笔记!

一、迭代器失效的概念

  1. 迭代器的作用与本质
  • 迭代器的主要作用是让算法无需关心底层数据结构,其底层实际为指针或对指针的封装。在vector中,迭代器本质上就是原生态指针T*(通过typedef定义为iterator,常量迭代器为const_iterator)。
namespace Harper 
{
    template<class T>
    class vector 
    {
    public:
        // 迭代器的你故意
        typedef T* iterator;
        typedef const T* const_iterator;
        // 其他成员函数和变量的定义
    //...
    };
}
  1. 迭代器失效的本质
  • 迭代器失效即迭代器底层对应指针所指向的空间被销毁,继续使用这种已释放空间的迭代器会导致程序崩溃,具体表现为:
    • 迭代器本质是指针,所以迭代器失效就是指针失效。
    • 指针失效意味着指针指向的空间非法,如指向已被释放的空间或者越界访问。

二、导致迭代器失效的操作

  1. 扩容相关操作
  • resizereserveinsertassignpush_back等可能引起扩容的操作,都可能导致迭代器失效(由野指针引起)。下面是push_back为例的 :
void push_back(const T& value) 
{
    if (_finish == _end_of_storage) 
    {
        size_t newcapacity = capacity() == 0? 4 : capacity() * 2;
        reserve(newcapacity);
    }
    *_finish = value;
    ++_finish;
}
  • 在这个过程中,如果有其他迭代器指向原来的vector空间,那么在扩容后这些迭代器就可能失效。
  1. 指定位置的插入与删除操作
  • inserterase这类指定位置的操作,可能使迭代器指向的位置意义发生改变,从而导致迭代器失效。

三、避免迭代器失效的方法

3.1 insert函数的迭代器失效问题及解决

3.1.1 扩容导致野指针的情况

  • 问题描述:给出insert的初始版本代码,在测试中发现,例如先push_back尾插一定数量元素后调用insert可能出现随机值问题(如尾插4个元素后调用insert出现随机值,尾插5个调用insert无此问题)。这是因为pos未更新,扩容时_start_finish更新,而pos仍指向旧空间,旧空间释放后pos成为野指针,后续*pos = x操作非法访问野指针。

  • 解决方法:计算扩容前pos_start的相对距离n,扩容后让pos = _start + n,使pos始终指向正确位置。修改后的insert函数如下:

void insert(iterator pos, const T& x) 
{
    //检测参数合法性
    assert(pos >= _start && pos <= _finish);
    /*扩容以后pos就失效了,需要更新一下*/
    if (_finish == _end_of_stoage) 
    {
        size_t n = pos - _start;
        size_t newcapcacity = capacity() == 0? 4 : capacity() * 2;
        reserve(newcapcacity);
        pos = _start + n;
    }
    //挪动数据
    iterator end = _finish - 1;
    while (end >= pos) 
    {
        *(end + 1) = *(end);
        end--;
    }
    //把值插进去
    *pos = x;
    _finish++;
}

3.1.2 迭代器指向位置意义改变的情况

  • 问题描述:以在所有偶数前插入2为例,在测试代码中发现会发生断言错误。当insert插入可能扩容时,原空间数据拷贝到新空间,旧空间变为野指针,而外部迭代器it一直指向旧空间,遍历it时会非法访问野指针导致失效;即使不扩容,it指向位置意义改变,会导致程序重复插入元素。

  • 解决方法:给insert函数加上返回值(返回指向新插入元素的位置),调用时让迭代器接收insert的返回值。修改后的insert函数如下:

iterator insert(iterator pos, const T& x) 
{
    //检测参数合法性
    assert(pos >= _start && pos <= _finish);
    //检测是否需要扩容
    /*扩容以后pos就失效了,需要更新一下*/
    if (_finish == _end_of_stoage) 
    {
        size_t n = pos - _start;
        size_t newcapcacity = capacity() == 0? 4 : capacity() * 2;
        reserve(newcapcacity);
        pos = _start + n;
    }
    //挪动数据
    iterator end = _finish - 1;
    while (end >= pos) 
    {
        *(end + 1) = *(end);
        end--;
    }
    //把值插进去
    *pos = x;
    _finish++;
    return pos;
}

测试函数:

// 测试函数
void testinsert() 
{
    my_vector::vector<int> v1;
    v1.push_back(1);
    v1.push_back(2);
    v1.push_back(3);
    v1.push_back(4);
    v1.push_back(5);
    v1.push_back(6);
    my_vector::vector<int>::iterator it = v1.begin();
    while (it!= v1.end()) 
    {
        if (*it % 2 == 0) 
        {
            it = v1.insert(it, 20);
        }
        ++it;
    }
    for (auto num : v1) 
    {
        std::cout << num << " ";
    }
    std::cout << std::endl;
}

3.2 erase函数的迭代器失效问题及解决

  1. 问题描述

    • 给出erase的初始版本代码,erase的失效多为迭代器指向的位置意义发生改变或不在有效访问数据范围内。测试中发现,如删除vector中的元素后再访问或修改已删除元素的下一个元素可能出现问题(如尾插 4 个数字后删除特定元素,后续访问修改该元素下一个元素可能出错;删除所有偶数的测试中也会出现类似问题)。
  2. 解决方法

    • erase函数加上返回值(返回指向新插入元素的位置),调用时让迭代器接收erase的返回值。修改后的erase函数如下:
iterator erase(iterator pos) 
{
    //检查合法性
    assert(pos >= _start && pos < _finish);
    //从pos + 1的位置开始往前覆盖,即可完成删除pos位置的值
    iterator it = pos + 1;
    while (it < _finish) 
    {
        *(it - 1) = *it;
        it++;
    }
    _finish--;
    return pos;
}

四、迭代器失效总结

vector迭代器失效主要有两种情况:

  1. 扩容、缩容导致野指针式失效。
  2. 迭代器指向的位置意义改变。

注意,系统越界机制检查不一定能检测到迭代器失效问题,编译实现的检查机制相对更可靠。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值