数组是可以随机读取的数据结构,在数据量比较小的情况下,数组的顺序读取和随机读取几乎都能在瞬间完成,我们是感觉不到的,对我们的程序也不会感觉到有什么影响,但是在数据规模比较大的情况下,可能就会明显的影响到算法的性能。
下面测试不同数据规模下,数组的顺序读取和随机读取所耗费的时间。其中输入文件是随机产生的整数,每个整数一行。文件为txt格式。程序的工作原理很简单,请看main函数中的源代码,这样可以做到在其他条件都一致的条件下,观察顺序读取和随机读去对象能的影响。
#include <iostream>
#include <fstream>
#include <string>
#include <stdlib.h>
#include <sys/time.h>
#define MAX 10000000
using namespace std;
void readNum(int a[]){
string filename;
ifstream infile("data_1000w.txt", ios::in);
string textline = "";
int i = 0;
while(getline(infile, textline, '\n')){
a[i] = atoi(string(textline).c_str());
i++;
}
infile.close();
}
long getCurrentTime(){
struct timeval tv;
gettimeofday(&tv, NULL);
return tv.tv_sec * 1000 + tv.tv_usec / 1000;
}
int main()
{
int a[MAX] = {0};
int b[MAX] = {0};
int c[MAX] = {0};
int d[MAX] = {0};
readNum(a);
readNum(b);
cout << "Number Counts:" << MAX << endl;
cout << "Sort Result:" << endl;
long time_1 = getCurrentTime();
int max = 0;
for(int i = 0; i < MAX-1; i++){
max = a[i];
c[i] = a[i+1];
}
long time_2 = getCurrentTime();
cout << time_2 - time_1 << " ms" << endl;
long time_3 = getCurrentTime();
int min = 0;
for(int j = 0; j < MAX-1; j++){
min = c[j];
d[j] = c[min];
}
long time_4 = getCurrentTime();
cout << time_4 - time_3 << " ms" << endl;
return 1;
}
分别用100万数据和1000万数据做测试,结果如下图所示:
100万数据:顺序读取耗时5ms,随机读取耗时36ms。
1000万数据:顺序读取耗时52ms,随机读去耗时239ms。