并发的基本概念
所谓并发是在同一实体上的多个事件同时发生,并发编程是指在同一台计算机上“同时”出路多个任务。
要理解并发编程,我们必须要理解如下一些基本概念:
计算机就像一座工厂,时刻运行,为人类服务,它的核心是CPU,它承担了所有计算机任务,就像工厂的一个现场指挥官 。
进程就像工厂里的车间,承担“工厂”里的各项具体的“生产任务”,通常每个进程对应一个在运行中的执行程序,比如,QQ 和微信运行的时候,他们分别是不同的进程。
因为特殊原因,现场指挥官人才短缺,整个工厂只有一个指挥官,一次只能指导一个车间生产,而所有的车间都必须要有现场指挥官在场才能生产。也就是说,一个车间开工的时候,其他车间都必须停工。
背后的含义:任一时刻,单个 CPU 一次只能运行一个进程,此时其他进程处于非运行状态。
一个车间(进程)可以包括多条生产线, 线程就好比车间(进程)里的生产线。所有生产线(设备和人)都属于同一车间的资源,受车间统一调度和调配,并共享车间所有资源(如空间或洗手间)。
背后的含义:一个进程可以拥有多个线程,每个线程可以可以独立并行执行,多个线程共
享同一进程的资源,受进程管理。
理解了以上这些概念后,我们接下来再继续讲解并行搜索的概念:
假设我们要从很大的一个无序的数据集中进行搜索,假设我们的机器可以一次性容纳这么多数据。从理论上讲,对于无序数据,如果不考虑排序,已经很难从算法层面优化了。而利用上面我们提到的并行处理思想,我们可以很轻松地将检索效率提升多倍。具体实现思路如下:
将数据分成 N 个块,每个块由一个 线程来并行搜索。
线程演示代码
#include <Windows.h>
#include <stdio.h>
#include <iostream>
#include <time.h>
#define TEST_SIZE (1024*1024*200)
#define NUMBER 20
DWORD WINAPI ThreadProc(void* lpParam) {
for (int i = 0; i < 5; i++) {
printf("进程老爸,我来了!\n");
Sleep(1000);
}
return 0;
}
int main(void) {
DWORD threadID1;//线程 1 的身份证
HANDLE hThread1;//线程 1 的句柄
DWORD threadID2;//线程 2 的身份证
HANDLE hThread2;//线程 2 的句柄
printf("创建线程... ... \n");
//创建线程 1
hThread1 = CreateThread(NULL, 0, ThreadProc, NULL, 0, &threadID1);
//创建线程 2
hThread2 = CreateThread(NULL, 0, ThreadProc, NULL, 0, &threadID2);
WaitForSingleObject(hThread1, INFINITE);
WaitForSingleObject(hThread2, INFINITE);
printf("进程老爸欢迎线程归来!\n");
system("pause");
return 0;
}
运行结果
我们查找一段1024*1024*200大小的数组。
完整代码
#include <Windows.h>
#include <stdio.h>
#include <iostream>
#include <time.h>
#define TEST_SIZE (1024*1024*200)
#define NUMBER 20
typedef struct _search {
int* data;//搜索的数据集
size_t start; //搜索的开始位置
size_t end; //搜索的终止位置
size_t count; //搜索结果
}search;
DWORD WINAPI ThreadProc(void* lpParam) {
search* s = (search*)lpParam;
time_t start, end;
printf("新的线程开始执行...\n");
time(&start);
for (int j = 0; j < 10; j++) {
for (size_t i = s->start; i <= s->end; i++) {
if (s->data[i] == NUMBER) {
s->count++;
}
}
}
time(&end);
printf("查找数据所花时间: %lld\n", end - start);
return 0;
}
int main(void) {
int* data = NULL;
int count = 0;//记录的数量
data = new int[TEST_SIZE];
for (int i = 0; i < TEST_SIZE; i++) {
data[i] = i;
}
time_t start = 0, end = 0;//记录开始和结束的时间戳
time(&start);
for (int j = 0; j < 10; j++) {
for (int i = 0; i < TEST_SIZE; i++) {
if (data[i] == NUMBER) {
count++;
}
}
}
time(&end);
printf("查找数据所花时间: %lld, count: %d\n", end - start, count);
system("pause");
return 0;
}
运行结果