通过“聚类”可以获得有关我们所拥有的数据的各种线索,这是数据挖掘技术之一。分析创建的组有助于决策过程。在这项研究中,我们将使用数据挖掘工具之一的K-Means方法研究安纳托利亚东部地区近100年发生的地震的空间分布,并试图获得有用的信息,以供未来的研究使用。
我从美国地质调查局地震目录页面获得了研究所需的地震数据,并从土耳其测绘总局获得了区域边界数据。
1. K-Means算法
K-Means 方法是数据挖掘中最常用的聚类方法之一。此方法根据欧几里得距离,根据彼此之间的距离将数据划分为几组。该方法的目的是使同一聚类中的数据尽可能相似,而不同聚类中的数据应尽可能不同。K-Means算法的处理步骤如下;
- 确定聚类数(K 值)。
- 聚类是考虑 K 值的,每个点随机包含在任何聚类中。
- 计算每个点到每个聚类中心的距离。
- 这些点根据它们与聚类中心的距离(最短距离)分配给其新聚类。
- 根据点的最新状态,确定新的集群中心。
- 此过程将持续到点之间的聚类更改完成为止。
2.弯头法
聚类分析过程中最重要的步骤之一是确定聚类的数量,此值应由分析师确定。肘部法是为解决这个问题而开发的方法之一。使用这种方法,可以得到一个图形。在此图中,x 轴表示聚