数据规模对数组的读取效率的影响——顺序读取和随机读取


        数组是可以随机读取的数据结构,在数据量比较小的情况下,数组的顺序读取和随机读取几乎都能在瞬间完成,我们是感觉不到的,对我们的程序也不会感觉到有什么影响,但是在数据规模比较大的情况下,可能就会明显的影响到算法的性能。

        下面测试不同数据规模下,数组的顺序读取和随机读取所耗费的时间。其中输入文件是随机产生的整数,每个整数一行。文件为txt格式。程序的工作原理很简单,请看main函数中的源代码,这样可以做到在其他条件都一致的条件下,观察顺序读取和随机读去对象能的影响。

#include <iostream>
#include <fstream>
#include <string>
#include <stdlib.h>
#include <sys/time.h>

#define MAX 10000000

using namespace std;

void readNum(int a[]){
	string filename;
	ifstream infile("data_1000w.txt", ios::in);
	string textline = "";
	int i = 0;
	while(getline(infile, textline, '\n')){
		a[i] = atoi(string(textline).c_str());
		i++;
	}
	infile.close();
}

long getCurrentTime(){
	struct timeval tv;
	gettimeofday(&tv, NULL);
	return tv.tv_sec * 1000 + tv.tv_usec / 1000;
}

int main()
{
	int a[MAX] = {0};
	int b[MAX] = {0};
	int c[MAX] = {0};
	int d[MAX] = {0};

	readNum(a);
	readNum(b);

	cout << "Number Counts:" << MAX << endl;
	cout << "Sort Result:" << endl;

	long time_1 = getCurrentTime();
	int max = 0;	
	for(int i = 0; i < MAX-1; i++){
		max = a[i];
		c[i] = a[i+1];
	}
	long time_2 = getCurrentTime();	
	cout << time_2 - time_1 << " ms" << endl;

	long time_3 = getCurrentTime();
	int min = 0;
	for(int j = 0; j < MAX-1; j++){
		min = c[j];
		d[j] = c[min];
	}
	long time_4 = getCurrentTime();
	cout << time_4 - time_3 << " ms" << endl;
	
	
	return 1;
}

分别用100万数据和1000万数据做测试,结果如下图所示:

100万数据:顺序读取耗时5ms,随机读取耗时36ms。

1000万数据:顺序读取耗时52ms,随机读去耗时239ms。



        看了以上的结果,奋斗在IT一线的同志们,以后写程序可要注意了,数组虽然是一种随机存取的数据结构,但也要看数据的规模哦。如果亲们写算法的时候需要处理大量的数据,那么尽量优化算法,使用顺序的方式读取数组吧。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值