背景
昨天新公司有同事分享了一个关于线程调度的主题,其中的一个细节谈到多线程下的共享变量的访问问题。有一个同事说,两个或多个线程对同一个线程都能访问的变量之所以不符合预期(比如说有2个线程,每个线程都对同一个全局变量进行++操作10000次,那么最终结果不一定是20000),是因为数据缓存在cache,而线程做++操作时,不是从内存中读取,而是从cache中读取导致的。
我不认可他的说法,我认为根本原因是++操作不是原子操作,不能保证操作的原子性;因此做了一个小测试。
测试
直接看代码:
#include <stdio.h>
#include <pthread.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/time.h>
#include <stdint.h>
volatile int count = 0; // 或者是 int count = 0
void *test_func(void *arg)
{
int i=0;
for(i=0;i<10000000;++i)
{
//__sync_fetch_and_add(&count,1);
count++;
}
return NULL;
}
int main(int argc, const char *argv[])
{
pthread_t id[2];
int i = 0;
for(i=0;i<2;++i)
{
pthread_create(&id[i],NULL,test_func,NULL);
}
for(i=0;i<2;++i)
{
pthread_join(id[i],NULL);
}
printf("count = %d\n", count);
return 0;
}
结果:
可以发现,哪怕是在加了volatile之后,还是不能保证count等于20000000;根本原因就是count++操作并不是原子操作;在线程1取了count(假设此时count的值是100)做++的过程中(此时++还没结束,count还是100),线程2来取count(此时count还是100),在线程1完成++操作后写入了内存(此时内存中count的值是101),然后线程2页完成了count++(线程2中的count也是101,此时线程2中的count是在寄存器中,而不是内存中)操作,也把count(从线程2的cpu的寄存器)写入到内存中,count在内存中的值还是101——这样的话,就会导致count的最终的值不是20000000;
原理
volatile的本质是什么?它的设计初衷是什么?应用场景又是哪些?
我看到一篇不错的文章,链接如下:
C/C++ Volatile关键词深度剖析
从汇编层面给出了volatile关键字添加之前的对比,从而确定volatile关键字的作用就是:
保证每次访问变量时,都是从内存中读取,而不是从cache或者说寄存器中直接使用;
此处还应该深挖一下,待补充!!!
结论
待补充!!!