DBSCAN

# -*- coding: utf-8 -*-

import numpy as np
from ExpandCluster import Expand_Cluster
from SearchRecord import ClusterSum

UNCLASSIFIED = False
NOISE = 0

def LoadDataSet(fileName, splitChar='\t'):
    """
    输入:文件名
    输出:数据集
    描述:从文件读入数据集
    """
    #   请在此添加实现代码     #
    #********** Begin *********#
    #从txt文件中读取数据
    dataSet = []
    with open(fileName) as fr:
        for line in fr.readlines():
            curline = line.strip().split(splitChar)
            fltline = list(map(float, curline))
            dataSet.append(fltline)
    return dataSet
    #********** End ***********#

def DBScan(data, eps, minPts):
    """
    输入:数据集, 半径大小, 最小点个数
    输出:分类簇id
    """
    #   请在此添加实现代码     #
    #********** Begin *********#
    #调用Expand_Cluster函数,开始聚类
    clusterId = 1
    nPoints = data.shape[1]
    clusterResult = [UNCLASSIFIED] * nPoints
    for pointId in range(nPoints):
        point = data[:, pointId]
        if clusterResult[pointId] == UNCLASSIFIED:
            if Expand_Cluster(data, clusterResult, pointId, clusterId, eps, minPts):
                clusterId = clusterId + 1
    return clusterResult, clusterId - 1
    #********** End ***********#

def main():
    dataSet = LoadDataSet('DBScan/DataPoints.txt', splitChar=',')
    dataSet = np.mat(dataSet).transpose()
    clusters, clusterNum = DBScan(dataSet, 2, 15)
    print("cluster Numbers = ", clusterNum)
    clustersum = ClusterSum(clusters, clusterNum)
    print(clustersum)

if __name__ == '__main__':
    main()

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值