在并行程序开发中,存在多种并行库选择,且往往for循环并行时会面临数据竞争问题,本文为初步测试多线程for不同库在数据竞争下的效率对比,cilkplus为Intel的一个多线程库(gcc 7.5后移除了该库),OpenMP为使用较多的多线程库。
注意:初步测试,数据可能存在误差,ubuntu22系统,编译器使用g++-7.5,编译优化为-O3
1 测试代码
#include <iostream>
#include <omp.h>
#include <cilk/cilk.h>
#include "parallel.h"
#include "gettime.h"
using namespace std;
// CAS func (atomic)
template <class ET>
inline bool CAS(ET *ptr, ET oldv, ET newv) {
if (sizeof(ET) == 1) {
return __sync_bool_compare_and_swap((bool*)ptr, *((bool*)&oldv), *((bool*)&newv));
} else if (sizeof(ET) == 4) {
return __sync_bool_compare_and_swap((int*)ptr, *((int*)&oldv), *((int*)&newv));
} else if (sizeo