本文章纯粹是我学习openmp的学习整理,仅用作自我记录和参考。
注释
/* */ 段注释
// 行注释
时间相关
clock_t是一个长整型数
clock()返回单位是毫秒。即自程序启动以来经过的时钟滴答数,如果想返回秒为单位,则可以用计算出来的数值/CLOCKS_PER_SEC
clock_t begin, end;
float seconds;
begin = clock();
func();
end = clock();
seconds = (begin - end) /(float) CLOCKS_PER_SEC;
printf("%f seconds\n", seconds);
在time.h文件中,定义了一个常量CLOCKS_PER_SEC,它用来表示一秒钟会有多少个时钟计时单元
数组
CPU核数
我的有4个
任务管理器查看CPU处理核心数
1、我们也可以在Windows10桌面,右键点击桌面底部的任务栏,在弹出菜单中选择“任务管理器”菜单项;
2、这时就会打开任务管理器窗口,点击窗口中的“性能”选项卡;
3、这时就会在打开的性能窗口中,点击左侧边栏的“CPU”选项卡,在右侧窗口中就可以看到CPU的核心数了。
单核vs多核运行
#include<stdio.h>
#include<time.h>
#include<omp.h>
void test()
{
int a = 0;
int i;
for (i = 0; i < 100000000; i++){
a++;
}
}
int main()
{
int i;
clock_t t1 = clock();
//#pragma omp parallel for
for (i = 0; i < 8; i++) {
test();
}
clock_t t2 = clock();
printf("total time :%d\n",t2 - t1);//怎么样输出时间,多少分,多少秒
return 0;
}
这里只用了一句话把代码由单核运行变成多核运行
#pragma omp parallel for
(当然,为了能够多核运行,加了<omp.h>)
单核运行时间:3002 多核的运行时间:1027
对添加的这句代码做一个剖析。当编译器发现这行代码时,自动将下面的for循环分成N份(N为电脑的CPU核数),然后把每份派给一个核去执行,而且多核之间为并行执行。
下面的代码验证了并行执行。
int main() {
int i = 0;
#pragma omp parallel for
for (i = 0; i < 10; i++) {
printf("%d", i);
}
return 0;
}
控制台输出:0126734895
因为每个核之间是并行执行,所以每次执行时打印出来的顺序都可能是不一样的。
竞态条件 race condition
这是所有多线程编程最棘手的问题。
该问题可以表述为,当多个线程并行执行时,有可能多个线程同时对某变量进行了读写,从而导致不可预知的结果,比如下面的例子,对于包含10个整形元素的数组a,我们用for循环求它各元素之和,并将结果保存在变量sum里。
int main() {
int sum = 0;
int a[10] = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10};
int i;
#pragma omp parallel for
for (i=0; i < 10; i+&#