在实际应用中,用户分组是一项重要的任务,可以将用户按照某种相似性标准进行划分,以便更好地理解和满足他们的需求。本文将介绍一种常见的用户分组算法 - k-means聚类算法,并提供相应的源代码实现。
k-means算法是一种简单而有效的聚类算法,它将n个数据对象划分为k个不同的组或类,使得组内的数据对象相似度最高,而组间的相似度最低。该算法的基本思想是,通过迭代优化来找到使得聚类误差最小的k个聚类中心。
下面是使用Python实现的k-means算法的代码示例:
import numpy as np
def kmeans(data, k, max_iter=100):
# 初始化聚类中心
centroids = data[np