数据挖掘—K-Means算法（Java实现）

最新推荐文章于 2024-08-29 10:51:12 发布

Gogo-2020

最新推荐文章于 2024-08-29 10:51:12 发布

阅读量637

点赞数

分类专栏：数据挖掘文章标签：聚类算法 java

本文链接：https://blog.csdn.net/weixin_44560620/article/details/113432683

版权

本文介绍了K-Means算法的详细步骤，并提供了Java实现代码，包括选择初始聚类中心，根据对象相似性分配簇，更新簇平均值以及计算准则函数E的过程。

摘要由CSDN通过智能技术生成

算法描述

（1）任意选择k个数据对象作为初始聚类中心
（2）根据簇中对象的平均值，将每个对象赋给最类似的簇
（3）更新簇的平均值，即计算每个对象簇中对象的平均值
（4）计算聚类准则函数E
（5）重复2-4步骤，直到准则函数E值不再进行变化

代码


public class Cluster {
   
    public String clusterName; // 类簇名
    private Medoid medoid; // 类簇的质点
    private ArrayList<DataPoint> dataPoints; // 类簇中各样本点

    public Cluster(String clusterName) {
   
        this.clusterName = clusterName;
        this.medoid = null; // will be set by calling setCentroid()
        dataPoints = new ArrayList<DataPoint>();
    }

    public void setMedoid(Medoid c) {
   
        medoid = c;
    }

    public Medoid getMedoid() {
   
        return medoid;
    }


    public void addDataPoint(DataPoint dp) {
    // called from CAInstance
        dp.setCluster(this);// 标注该类簇属于某点,计算欧式距离
        this.dataPoints.add(dp);
    }

    public void removeDataPoint(DataPoint dp) {
   
        this.dataPoints.remove(dp);
    }

    public int getNumDataPoints() {
   
        return this.dataPoints.size();
    }

    public DataPoint getDataPoint(int pos) {
   
        return (DataPoint) this.dataPoints.get(pos);
    }


    public String getName() {
   
        return this.clusterName;
    }

    public ArrayList<DataPoint> getDataPoints() {
   
        return this.dataPoints;
    }
}


public class ClusterAnalysis {
   

    public Cluster[] clusters;// 所有类簇
    private int miter;// 迭代次数
    private ArrayList<DataPoint> dataPoints = new ArrayList<DataPoint>();// 所有样本点
    private int dimNum;//维度

    public ClusterAnalysis(int k, int iter, ArrayList<DataPoint> dataPoints,int dimNum) {
   
        clusters = new Cluster[k];// 类簇种类数
        for (int i = 0; i < k; i++) {
   
            clusters[i] = new Cluster(i+"");
        }
        this.miter = iter;
        this.dataPoints = dataPoints;
        this.dimNum=dimNum;
    }

    public int getIterations() {
   
        return miter;
    }

    public ArrayList<DataPoint>[] getClusterOutput() {
   
        ArrayList<DataPoint> v[] = new ArrayList[clusters.length];
        for (int i = 0; i < clusters.length; i++) {
   
            v[i] = clusters[i].getDataPoints();
        }
        return v;
    }


    public void startAnalysis(double[][] medoids) {
   

        setInitialMedoids(medoids);

        double[][] newMedoids=medoids;
        double[][] oldMedoids=new double[medoids.length][this.dimNum];

        while(!isEqual(oldMedoids,newMedoids)){