编译环境为 codeblocks 17.12
编译的语言为C++
问题描述
数据结构作业,老师要求用 100 W 的随机数做排序,测试各种排序算法的时间及性能。在作业的过程中就发现,当直接开辟数组超过一定大小后会产生溢出,这里就涉及到 C++ 如何开辟大数组的问题
直接开辟 100w 大小数组,内存溢出。
产生原因
用 C 语言直接定义数组,数组空间是开辟在 C 语言占用内存空间的栈区,而栈区开辟的内存有限导致内存溢出。
这里需要普及一下C语言内存分配的问题,C语言占用的内存可以分为5个区:
①代码区(Text Segment):用于放置编译过后的代码的二进制机器码。
②堆区(Heap):用于动态内存分配。一般由程序员分配和释放,若程序员不释放,结束程序时有可能由操作系统回收。(其实就是malloc()函数能够掌控的内存区域)
③栈区(Stack):由编译器自动分配和释放,一般用来存放局部变量、函数参数(敲黑板划重点了!)。
④全局初始化数据区/静态数据区(Data Segment):顾名思义,就是存放全局变量和静态变量的地方。这个区域被整个进程共享。
⑤未初始化数据区(BSS):在运行时改变值。改变值(初始化)的时候,会根据它是全局变量还是局部变量,进到他们该去的区。相当于临时存放的一个地方,不知道设置这个区的意义是什么,这个有待进一步研究。
在 Windows 下,Data Segment 的所允许的空间大小取决于剩余内存的大小,也就是说,如果电脑剩余 8 G 内存的话,int 类型的二维数组甚至可以开到 46340*46340 的大小,没有亲自试验过。
而Stack的空间只有 2 M !也就是 210241024=2097152 字节,局部变量空间顶多放得下下 524288 个 int 类型,这也就是为什么数组直接开 100 w 大小会爆掉。
解决办法
方法一:用 malloc( ) 函数定义数组,这样可以将数组开辟在堆区。
方法二:定义全局变量或者静态变量,这两者的作用和效果都是一样的。
对于百万级别的数组,这两种办法都能够很好的解决。
下面我们测试一下这两种方法下数组开到多大会爆掉。。
第一方法:下面是我手调加上程序得出来的能开辟出来的最大空间
491,830,259*4=1,967,321,036(字节)
1,967,321,036 / 1024 ≈ 1,921,211 (KB)
1,921,211 / 1024 ≈ 1876 (MB)
我的电脑总内存是 8 GB ,能够开到这么大也算合理,具体可能会因为电脑配置的不同而不一样。
第二种方法:直接测试上面的最大值,可以看出,没有问题。
继续往上加到这个数的时候出现了可能崩的情况
可以看出这种分配方法跟计算机的内存应该有很大的关系,但是跟上面方面最大能开辟的空间差距不大。最大都是不到 2 GB,不管用什么方法 2 GB 应该都是极限了,但是这个足够应付我们的日常编程,哪怕是暴力解法,两种方法都是可取的,个人偏向于方法一,便于内存的回收。