利用 NumPy 可以对大数据进行简单的统计分析,包括数据文件的读取、数据列的提取、数据类型的转换和各种统计计算,还有数据的排序、搜索和计数等。现以中国历史地震数据分析为例来介绍简单的统计分析思路。
【例 1】将中国历史地震数据文件命名为 earthquakes.csv 文件。该文件中包含的数据列有日期、时间、地震发生纬度与经度、深度(km)、震级、烈度和精确度等。数据包括 1969 年 12 月 22 日以前中国历史上所发生的地震数据,其中部分数据列表显示如下。
日期,时间(北京时),纬度(度-分),经度(度-分),深度(km),震级,烈度,精确度
408/00/00,::.,"39°00""","100°30""",,4.75,VI,9,
416/00/00,::.,"34°18""","105°30""",,5,VI,9,
421/00/00,::.,"41°36""","120°24""",,5,VI,9,
462/08/16,::.,"35°00""","116°48""",,6,VIII,9,
495/03/31,::.,"37°30""","121°30""",,5.5,VII,9,
…………………………………………………………………………………………………………………
1969/12/7,52:39.0,"23°42""","121°54""",3.3,5.1,,9
1969/12/17,00:04.0,"18°30""","110°36"