我一直在
In an OpenMP parallel code,would there be any benefit for memset to be run in parallel?测试代码,我正在观察一些意想不到的事情.
我的系统是一个单插槽Xeon E5-1620,它是一个Ivy Bridge处理器,有4个物理内核和8个超线程.我使用的是Ubuntu 14.04 LTS,Linux Kernel 3.13,GCC 4.9.0和EGLIBC 2.19.我用gcc -fopenmp -O3 mem.c编译
当我在链接中运行代码时,它默认为八个线程并给出
Touch: 11830.448 MB/s
Rewrite: 18133.428 MB/s
但是,当我绑定线程并将线程数设置为这样的物理核心数
export OMP_NUM_THREADS=4
export OMP_PROC_BIND=true
我明白了
Touch: 22167.854 MB/s
Rewrite: 18291.134 MB/s
触控率增加了一倍!绑定后运行几次总是比重写更快.我不明白这一点.绑定线程并将其设置为物理核心数后,为什么触摸比重写更快?为什么触控率翻倍?
这是我使用的代码,没有修改Hristo Iliev的答案.
#include
#include
#include
void zero(char *buf,size_t size)
{
size_t my_start,my_size;
if (omp_in_parallel())
{
int id = omp_get_thread_num();
int num