#include<stdio.h>
#include <cstdio>
#include<string>
#include<math.h>
#include<stdlib.h>
#include<set>
#include<map>
#include<vector>
#include<queue>
#include<string.h>
#include<algorithm>
#include<iostream>
#include<time.h>
using namespace std;
//Author: I-Hsin
const int maxn=100000;//原始数据量的上界
vector<double>node[maxn];//存储原始数据
int K;//簇的数目
vector<double>center[maxn];//存储均值中心
vector< vector<double> >clusters[maxn];//存储k个聚类
int number;//输入数据的数目
int dimension;//输入数据的维数
double EuclideanDistance(vector<double> a,vector<double> b)//计算两个数据之间的欧几里得距离
{
double sum=0;
for(int i=0;i<a.size();i++)
{
sum+=(a[i]-b[i])*(a[i]-b[i]);
}
sum=sqrt(sum);
return sum;
}
void ChooseSeeds()//选择k个点作为初始的聚类中心,此处用k-means++算法优化,不是随机选择
{
srand((unsigned int) time(NULL));
int i
数据挖掘作业——K-Means算法之C++实现
最新推荐文章于 2022-04-30 17:15:58 发布
本文详细介绍了如何使用C++实现K-Means聚类算法,包括选择初始聚类中心、计算欧几里得距离、更新簇的均值中心等步骤,通过实例展示了算法的具体过程。
摘要由CSDN通过智能技术生成