数据挖掘—K-Means算法(Java实现)

本文介绍了K-Means算法的详细步骤,并提供了Java实现代码,包括选择初始聚类中心,根据对象相似性分配簇,更新簇平均值以及计算准则函数E的过程。
摘要由CSDN通过智能技术生成

算法描述

(1)任意选择k个数据对象作为初始聚类中心
(2)根据簇中对象的平均值,将每个对象赋给最类似的簇
(3)更新簇的平均值,即计算每个对象簇中对象的平均值
(4)计算聚类准则函数E
(5)重复2-4步骤,直到准则函数E值不再进行变化

代码


public class Cluster {
   
    public String clusterName; // 类簇名
    private Medoid medoid; // 类簇的质点
    private ArrayList<DataPoint> dataPoints; // 类簇中各样本点

    public Cluster(String clusterName) {
   
        this.clusterName = clusterName;
        this.medoid = null; // will be set by calling setCentroid()
        dataPoints = new ArrayList<DataPoint>();
    }

    public void setMedoid(Medoid c) {
   
        medoid = c;
    }

    public Medoid getMedoid() {
   
        return medoid;
    }


    public void addDataPoint(DataPoint dp) {
    // called from CAInstance
        dp.setCluster(this);// 标注该类簇属于某点,计算欧式距离
        this.dataPoints.add(dp);
    }

    public void removeDataPoint(DataPoint dp) {
   
        this.dataPoints.remove(dp);
    }

    public int getNumDataPoints() {
   
        return this.dataPoints.size();
    }

    public DataPoint getDataPoint(int pos) {
   
        return (DataPoint) this.dataPoints.get(pos);
    }


    public String getName() {
   
        return this.clusterName;
    }

    public ArrayList<DataPoint> getDataPoints() {
   
        return this.dataPoints;
    }
}


public class ClusterAnalysis {
   

    public Cluster[] clusters;// 所有类簇
    private int miter;// 迭代次数
    private ArrayList<DataPoint> dataPoints = new ArrayList<DataPoint>();// 所有样本点
    private int dimNum;//维度

    public ClusterAnalysis(int k, int iter, ArrayList<DataPoint> dataPoints,int dimNum) {
   
        clusters = new Cluster[k];// 类簇种类数
        for (int i = 0; i < k; i++) {
   
            clusters[i] = new Cluster(i+"");
        }
        this.miter = iter;
        this.dataPoints = dataPoints;
        this.dimNum=dimNum;
    }

    public int getIterations() {
   
        return miter;
    }

    public ArrayList<DataPoint>[] getClusterOutput() {
   
        ArrayList<DataPoint> v[] = new ArrayList[clusters.length];
        for (int i = 0; i < clusters.length; i++) {
   
            v[i] = clusters[i].getDataPoints();
        }
        return v;
    }


    public void startAnalysis(double[][] medoids) {
   

        setInitialMedoids(medoids);

        double[][] newMedoids=medoids;
        double[][] oldMedoids=new double[medoids.length][this.dimNum];

        while(!isEqual(oldMedoids,newMedoids)){
   
            
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值