K均值算法(K-means)R语言代码
K均值算法(K-means)是一种常用的聚类算法,它将数据集分成K个不重叠的簇,其中每个数据点都属于距离其最近的簇。本文将介绍如何使用R语言实现K均值算法,并提供相应的源代码。
首先,我们需要安装并加载必要的R包。使用以下代码安装和加载"stats"和"cluster"包:
# 安装包
install.packages("stats")
install.packages("cluster")
# 加载包
library(stats)
library(cluster)
接下来,我们将使用一个示例数据集来演示K均值算法。假设我们有一个包含两个特征的数据集,即"dataset",其中包含N个数据点。以下是数据集的示例代码:
# 创建示例数据集
dataset <- data.frame(
x = c(1, 1.5, 3, 5, 3.5, 4.5, 3.5),
y = c(1, 2, 4, 7, 5, 5, 4)
)
现在,我们可以开始实现K均值算法。首先,我们需要选择要创建的簇的数量K。在这个例子中,我们选择K=2。以下是实现K均值算法的代码:
# 设置簇的数量
k <- 2
# 运行K均值算法
kmeans_result <- kmeans(dataset, centers = k)
# 输出簇的分配结果
cluster_labels <- kmeans_result$cluster
print(cl