经常有读者留言询问SPSS能够处理多大规模的数据集?用SPSS处理大数据集会不会卡顿?
为了解答大家的疑惑,松鼠进行了相关测试:在SPSS中,对不同规模的数据集执行多种不同的计算任务,记录它们所需的时间。将最终得到的分析结果清晰地展现在下面的两张表格中。
在下面的实验测评环节,使用的数据集变量相同,仅数据的行数不同。这些测试数据集都包含如下图所示的11个变量,数据集行数分别为10万、100万、1000万、10000万。(这些数据集是通过SPSS的【复杂抽样】功能进行有放回抽样而产生的)
测试分两种:
一、对变量相同、行数不同的数据集分别执行5种不同分析任务。
二、对变量相同、行数不同、不同格式的数据文件进行导入测试。
测试平台:处理器I7 7700K 、内存16GB ,所有测试均使用同一台电脑。
一、对变量相同、行数不同的数据集分别执行5种不同分析任务
对变量相同,不同规模的数据集进行5种不同的分析,所用时间如下表: