python中kmeans怎么导入数据集_用python2.7做kmeans聚类算法怎么导入数据

最新推荐文章于 2023-11-09 20:11:34 发布

weixin_39839478

最新推荐文章于 2023-11-09 20:11:34 发布

阅读量515

点赞数

文章标签： python中kmeans怎么导入数据集

展开全部

指定文2113件名

问题描述：一堆二维数据，用5261kmeans算法对其进行聚类，4102下面例子以分k=3为例。

原数据：1653

1.5,3.1

2.2,2.9

3,4

2,1

15,25

43,13

32,42

0,0

8,9

12,5

9,12

11,8

22,33

24,25

实现代码：

[python] view plain copy

#coding:utf-8

from numpy import *

import string

import math

def loadDataSet(filename):

dataMat = []

fr = open(filename)

for line in fr.readlines():

element = line.strip('\n').split(',')

number = []

for i in range(len(element)):

number.append(string.atof(element[i]))

dataMat.append(number)

return dataMat

def distEclud(vecA, vecB):

count = len(vecA)

s = 0.0

for i in range(0, count):

s = s + power(vecA[i]-vecB[i], 2)

return sqrt(s)

def clusterOfElement(means, element):

min_dist = distEclud(means[0], element)

lable = 0

for index in range(1, len(means)):

dist = distEclud(means[index], element)

if(dist < min_dist):

min_dist = dist

lable = index

return lable

def getMean(cluster): #cluster=[[[1,2],[1,2],[1,2]....],[[2,1],[2,1],[2,1],[2,1]...]]

num = len(cluster) #1个簇的num，如上为3个

res = []

temp = 0

dim = len(cluster[0])

for i in range(0, dim):

for j in range(0, num):

temp = temp + cluster[j][i]

temp = temp / num

res.append(temp)

return res

def kMeans():

k = 3

data = loadDataSet('data.txt')

print "data is ", data

inite_mean = [[1.1, 1], [1, 1],[1,2]]

count = 0

while(count < 1000):

count = count + 1

clusters = []

means = []

for i in range(k):

clusters.append([])

means.append([])

for index in range(len(data)):

lable = clusterOfElement(inite_mean, data[index])

clusters[lable].append(data[index])

for cluster_index in range(k):

mea = getMean(clusters[cluster_index])

for mean_dim in range(len(mea)):

means[cluster_index].append(mea[mean_dim])

for mm in range(len(means)):

for mmm in range(len(means[mm])):

inite_mean[mm][mmm] = means[mm][mmm]

print "result cluster is ", clusters

print "result means is ", inite_mean

kMeans()

2Q==

已赞过

已踩过<

你对这个回答的评价是？

评论

收起

weixin_39839478

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python中kmeans怎么导入数据集_用python2.7做kmeans聚类算法怎么导入数据

展开全部指定文2113件名问题描述：一堆二维数据，用5261kmeans算法对其进行聚类，4102下面例子以分k=3为例。原数据：16531.5,3.12.2,2.93,42,115,2543,1332,420,08,912,59,1211,822,3324,25实现代码：[python] view plain copy#coding:utf-8from numpy import *import ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。