Kmeans聚类算法及其java实现

本文深入探讨了Kmeans聚类算法的基本原理,并提供了详细的Java代码实现,通过实例展示了如何运用Kmeans进行数据分组和聚类。
摘要由CSDN通过智能技术生成

1.基本Kmeans算法

选择K个点作为初始质心  
repeat  
    将每个点指派到最近的质心,形成K个簇  
    重新计算每个簇的质心  
until 簇不发生变化或达到最大迭代次数  
时间复杂度:O(tKmn),其中,t为迭代次数,K为簇的数目,m为记录数,n为维数
空间复杂度:O((m+K)n),其中,K为簇的数目,m为记录数,n为维数



2.java实现


package com.ping;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.ArrayList;

public class kmeans {
	private int K;
	private int dataNum;
	private int dimNum;
	private ArrayList<double[]> tuples;
	private ArrayList<ArrayList<double[]>> cluster;
	private ArrayList<double[]> means;

	public kmeans(int K, int dataNum, int dimNum, ArrayList<double[]> tuples) {
		this.K = K;
		this.dataNum = dataNum;
		this.dimNum = dimNum;
		this.tuples = tuples;
		cluster = new ArrayList<ArrayList<double[]>>();
		for (int i = 0; i < K; ++i) {
			cluster.add(new ArrayList<double[]>());
		}
		means = new ArrayList<double[]>();

	}

	// 获取 tupleA 和 tupleB的距离 , 下标0存放记录编号,下标1到dimNum存放实际元素
	private double getDis(double tupleA[], double tupleB[]) {
		double dis = 0;
		for (int k = 1; k <= dimNum; ++k) {
			dis += (tupleA[k] - tupleB[k]) * (tupleA[k] - tupleB[k]);
	
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值