本程序是K均值聚类关于初始聚类中心选取的一种改进,原理来自于周志华的机器学习,这里只是尝试用python实现下。刚开始学习python,可能有问题大家觉得有用就借鉴下,如果哪里有问题还望指正。关于K均值聚类关于初始聚类中心选取的详细讨论我的博客另一篇文章详细介绍过,兴趣的可以去看看,这里只发我实现的python代码。
k均值代码参考来自于:# kmeans: k-means cluster
# Author : zouxy
# Date : 2013-12-25
# HomePage : http://blog.csdn.net/zouxy09
# Email : zouxy09@qq.com
main.py:
from centroids import *
from numpy import *
import time
import matplotlib.pyplot as plt
## step 1: load data
print ("step 1: load data...")
dataSet = []
fileIn = open('data3.txt')
for line in fileIn.readlines(): #依次读取每行
lineArr = line.strip().split('\t') #strip去掉每行头尾空白,对于每一行,
#split('\t')按照制