STL容器的线程安全

众所周知,STL容器不是线程安全的。

对于vector,即使写方(生产者)是单线程写入,但是并发读的时候,由于潜在的内存重新申请和对象复制问题,会导致读方(消费者)的迭代器失效。实际表现也就是招致了core dump。另外一种情况,如果是多个写方,并发的push_back(),也会导致core dump。

解法一:

加锁是一种解决方案,但是加std::mutex互斥锁确实性能较差。对于多读少写的场景可以用读写锁(也叫共享独占锁),来缓解。C++17引入了std::shared_mutex 。更多锁的种类可以阅读下面这篇回答,但是本回答的目的自然不是自我重复再次介绍一次锁的使用,请继续阅读解法二!

解法二:

更多的时候,其实可以通过固定vector的大小,避免动态扩容(无push_back)来做到lock-free!即在开始并发读写之前(比如初始化)的时候,给vector设置好大小。

struct Data {
...
};
vector<Data> v;
v.resize(1000);

注意是resize,不是reserve!

可能大家平时用reserve()比较多,顾名思义,reserve就是预留内存。为的是避免内存重新申请以及容器内对象的拷贝。

说白了,reserve()是给push_back()准备的!而resize除了预留内存以外,还会调用容器元素的构造函数,不仅分配了N个对象的内存,还会构造N个对象。从这个层面上来说,resize()在时间效率上是比reserve()低的。但是在多线程的场景下,用resize再合适不过。你可以resize好N个对象,多线程不管是读还是写,都是通过容器的下标访问【operator[]】来访问元素,不要push_back新元素。所谓的『写操作』在这里不是插入新元素,而是修改旧元素。

如果N的最大个数是可以预期的就直接设置就好,如果没办法预期就再把vector搞成ring buffer(环形队列)来缓解压力。可以给元素类加上成员变量标记当前的读写状态、是否被消费等等。

当然,你会说,如果B,C,D,E,F这个5个线程是等价的,要不停消费vector中的元素,会造成重复消费不?当然会。你可以把 队列头的下标定义程原子变量(std::atomic),尽管原子变量也需要做线程同步,但是比一般的锁开销要小很多啦。如果你想连原子变量也不用,有没有办法呢?有啊。那就给B,C,D,E,F分配不同的消费队列啊。

比如当前有5个读线程,那么每个线程就消费下标模5之后的某个固定结果的下标。比如:

B消费:051015、……
C消费:161116、……
D消费:271217、……
E消费:381318、……
F消费:491419、……

每个读线程各自维护自己当前消费的最新下标。这样做有啥问题没?也有,就是可能会导致不同的线程繁忙和等待的情况差异巨大:忙的忙死,闲的闲死。具体场景具体分析,总之,无论如何要控制住。不要让一个任务hang住整个线程。

关联容器的线程安全问题

vector是顺序容器,STL中还有一类关联容器其线程安全问题也不容小觑。比如map、unordered_map。我们可能会有这样一种场景:在并发环境下,收集一些Key-Value,存储在某一个公共的容器中。这里也谈一下不用锁的方案,当然做不到放之四海皆准。它有一些限制条件,只能看是否满足你的需要了。当有多个写线程对情况下,并发地插入 map/unordered_map都会引发core dump。对此,在某些场景下也可以避免加锁:如果全量的key有办法在并发之前就能拿到的,那么就对这个map,提前做一下insert。并发环境中如果只是修改value,而不是插入新key就不会core dump!不过如果你没办法保证多个写线程不会同时修改同一个key的value,那么可能存在value的覆盖。无法保证这点时,还是需要加锁。不过可以对key采取某种hash策略转成整型,然后进行分段加锁,减少一点锁冲突的概率,或者用一下CAS的策略。你还有什么好的思路,欢迎补充!

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
不知道网上有没有Effective STL(中文),我找不到,我自己整理出了这个《Effective STL(中文)》共享给需要的人。<br><br>《Effective STL》目录:<br><br>前言<br>致谢<br>导读<br>容器<br>条款1:仔细选择你的容器<br>条款2:小心对“容器无关代码”的幻想<br>条款3:使容器里对象的拷贝操作轻量而正确<br>条款4:用empty来代替检查size()是否为0<br>条款5:尽量使用区间成员函数代替它们的单元素兄弟<br>条款6:警惕C++最令人恼怒的解析<br>条款7:当使用new得指针的容器时,记得在销毁容器前delete那些指针<br>条款8:永不建立auto_ptr的容器<br>条款9:在删除选项中仔细选择<br>条款10:注意分配器的协定和约束<br>条款11:理解自定义分配器的正确用法<br>条款12:对STL容器线程安全性的期待现实一些<br>vector和string<br>条款13:尽量使用vector和string来代替动态分配的数组<br>条款14:使用reserve来避免不必要的重新分配<br>条款15:小心string实现的多样性<br>条款16:如何将vector和string的数据传给传统的API<br>条款17:使用“交换技巧”来修整过剩容量<br>条款18:避免使用vector<bool><br>关联容器<br>条款19:了解相等和等价的区别<br>条款20:为指针的关联容器指定比较类型<br>条款21:永远让比较函数对相等的值返回false<br>条款22:避免原地修改set和multiset的键<br>条款23:考虑使用有序vector代替关联容器<br>条款24:当关乎效率时应该在map::operator[]和map-insert之间仔细选择<br>条款25:熟悉非标准散列容器<br>迭代器<br>条款26:尽量用iterator代替const_iterator,reverse_iterator和const_reverse_iterator<br>条款27:用distance和advance把const_iterator转化成iterator<br>条款28:了解如何通过reverse_iterator的base得到iterator<br>条款29:需要一个一个字符输入时考虑使用istreambuf_iterator<br>算法<br>条款30:确保目标区间足够大<br>条款31:了解你的排序选择<br>条款32:如果你真的想删除东西的话就在类似remove的算法后接上erase<br>条款33:提防在指针的容器上使用类似remove的算法<br>条款34:注意哪个算法需要有序区间<br>条款35:通过mismatch或lexicographical比较实现简单的忽略大小写字符串比较<br>条款36:了解copy_if的正确实现<br>条款37:用accumulate或for_each来统计区间<br>仿函数、仿函数类、函数等<br>条款38:把仿函数类设计为用于值传递<br>条款39:用纯函数做判断式<br>条款40:使仿函数类可适配<br>条款41:了解使用ptr_fun、mem_fun和mem_fun_ref的原因<br>条款42:确定less<T>表示operator<.<br>使用STL编程<br>条款43:尽量用算法调用代替手写循环<br>条款44:尽量用成员函数代替同名的算法<br>条款45:注意count、find、binary_search、lower_bound、upper_bound和equal_range的区别<br>条款46:考虑使用函数对象代替函数作算法的参数<br>条款47:避免产生只写代码<br>条款48:总是#include适当的头文件<br>条款49:学习破解有关STL的编译器诊断信息<br>条款50:让你自己熟悉有关STL的网站<br>参考书目<br>附录A:区域设置和忽略大小写的字符串比较<br>附录B:在微软STL平台上的注意事项<br>词汇表<br>索引<br>关于本电子书

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值