数据规模对数组的读取效率的影响——顺序读取和随机读取

最新推荐文章于 2024-01-26 16:30:06 发布

时空霹雳

最新推荐文章于 2024-01-26 16:30:06 发布

阅读量2.3k

点赞数 3

分类专栏：算法学习文章标签： c++ 排序 sort

本文链接：https://blog.csdn.net/u010189459/article/details/27695933

版权

算法学习专栏收录该内容

37 篇文章 0 订阅

订阅专栏

数组是可以随机读取的数据结构，在数据量比较小的情况下，数组的顺序读取和随机读取几乎都能在瞬间完成，我们是感觉不到的，对我们的程序也不会感觉到有什么影响，但是在数据规模比较大的情况下，可能就会明显的影响到算法的性能。

下面测试不同数据规模下，数组的顺序读取和随机读取所耗费的时间。其中输入文件是随机产生的整数，每个整数一行。文件为txt格式。程序的工作原理很简单，请看main函数中的源代码，这样可以做到在其他条件都一致的条件下，观察顺序读取和随机读去对象能的影响。

#include <iostream>
#include <fstream>
#include <string>
#include <stdlib.h>
#include <sys/time.h>

#define MAX 10000000

using namespace std;

void readNum(int a[]){
	string filename;
	ifstream infile("data_1000w.txt", ios::in);
	string textline = "";
	int i = 0;
	while(getline(infile, textline, '\n')){
		a[i] = atoi(string(textline).c_str());
		i++;
	}
	infile.close();
}

long getCurrentTime(){
	struct timeval tv;
	gettimeofday(&tv, NULL);
	return tv.tv_sec * 1000 + tv.tv_usec / 1000;
}

int main()
{
	int a[MAX] = {0};
	int b[MAX] = {0};
	int c[MAX] = {0};
	int d[MAX] = {0};

	readNum(a);
	readNum(b);

	cout << "Number Counts:" << MAX << endl;
	cout << "Sort Result:" << endl;

	long time_1 = getCurrentTime();
	int max = 0;	
	for(int i = 0; i < MAX-1; i++){
		max = a[i];
		c[i] = a[i+1];
	}
	long time_2 = getCurrentTime();	
	cout << time_2 - time_1 << " ms" << endl;

	long time_3 = getCurrentTime();
	int min = 0;
	for(int j = 0; j < MAX-1; j++){
		min = c[j];
		d[j] = c[min];
	}
	long time_4 = getCurrentTime();
	cout << time_4 - time_3 << " ms" << endl;
	
	
	return 1;
}

分别用100万数据和1000万数据做测试，结果如下图所示：

100万数据：顺序读取耗时5ms，随机读取耗时36ms。