IRIS数据采用Kmeans方法的C++实现

该博客详细介绍了如何使用C++编程语言实现K-means聚类算法,以处理著名的IRIS数据集。通过对IRIS数据集进行聚类,展示了C++在数据处理和机器学习领域的应用。
摘要由CSDN通过智能技术生成

IRIS数据采用Kmeans方法的C++实现

参考:http://blog.csdn.net/cai0538/article/details/7061922

#include<iostream>
#include<fstream>
#include<vector>
#include<math.h>
#include<string>
#include<sstream>
#include<stdlib.h>
#include<time.h>
#define k 3

using namespace std;

//构建属性结构,读取txt文件中的字符串
struct Tuple {
	string attr1;
	string attr2;
	string attr3;
	string attr4;
	string attr5;
};

//构建属性结构,将数据转换为所需要的数据以及字符串
struct Tuple1 {
	float attr1;
	float attr2;
	float attr3;
	float attr4;
	string attr5;
};

//计算两个样本之间的欧式距离
float getDisXY(Tuple1 t1, Tuple1 t2) {
	float dis = 0;
	dis = sqrt((t1.attr1 - t2.attr1)*(t1.attr1 - t2.attr1) + (t1.attr2 - t2.attr2)*(t1.attr2 - t2.attr2)
		+ (t1.attr3 - t2.attr3)*(t1.attr3 - t2.attr3) + (t1.attr4 - t2.attr4)*(t1.attr4 - t2.attr4));
	return dis;
}

//根据质心判断属于那一类
int 
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,下面是一个使用 Python 实现Iris 数据集 Kmeans 聚类分析代码,不使用 Scikit-learn 库中的方法: ```python import numpy as np import pandas as pd # 加载数据集 iris = pd.read_csv('Iris.csv') X = iris.iloc[:, :-1].values # 定义 Kmeans 类 class KMeans: def __init__(self, n_clusters=3, max_iter=300): self.n_clusters = n_clusters self.max_iter = max_iter def fit(self, X): # 随机初始化聚类中心 self.centroids = X[np.random.choice(X.shape[0], self.n_clusters, replace=False), :] for i in range(self.max_iter): # 计算每个点到聚类中心的距离 distances = np.sqrt(((X - self.centroids[:, np.newaxis])**2).sum(axis=2)) # 找出每个点所属的聚类中心 labels = np.argmin(distances, axis=0) # 更新聚类中心 for j in range(self.n_clusters): self.centroids[j] = X[labels==j].mean(axis=0) def predict(self, X): # 计算每个点到聚类中心的距离 distances = np.sqrt(((X - self.centroids[:, np.newaxis])**2).sum(axis=2)) # 找出每个点所属的聚类中心 labels = np.argmin(distances, axis=0) return labels # 创建 KMeans 模型并训练数据 kmeans = KMeans(n_clusters=3) kmeans.fit(X) # 预测结果并输出 result = kmeans.predict(X) print(result) ``` 以上代码中,我们定义了一个 `KMeans` 类来实现 Kmeans 算法。在 `fit()` 函数中,我们首先随机初始化聚类中心,然后迭代更新聚类中心,直到达到最大迭代次数。在 `predict()` 函数中,我们根据已经训练好的聚类中心找出每个点所属的聚类中心。 需要注意的是,以上示例代码仅仅是一个简单的示例,实际应用中需要对数据进行更多的预处理和调参。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值