利用2分K均值算法对出租车地理坐标进行聚类

本文介绍了一种使用2分K均值算法对出租车地理坐标进行高效聚类的方法。通过Python和numpy库实现,该算法能够优化传统K均值的性能,提高大规模数据处理的效率。
摘要由CSDN通过智能技术生成

待处理数据结构类似如下:

39.894330	116.447680
40.016880	116.462120
39.889290	116.380930
39.917070	116.411380
39.830730	116.385380
39.931440	116.144310
39.934130	116.375550
39.905730	116.437740
39.919210	116.247520
39.807350	116.392500
39.979710	116.321450
39.945460	116.262660
39.913790	116.288990
39.915040	116.538690
39.907110	116.478820
39.780620	116.429860
39.909920	116.500270
39.973810	116.412050
40.158620	116.415050
39.831710	116.285880
39.947570	116.386780
39.945730	116.366110
39.989210	116.395050
39.883140	116.447220

代码如下:

from numpy import *

def loadDataSet(filename):
    fr = open(filename)
    positionMat = []
    for line in fr.readlines():
        currentLine = line.strip().split('\t')
        filterLine = map(float,currentLine)
        positionMat.append(filterLine)
    positionMat = mat(positionMat)
    return positio
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值