【chatgpt代码系列】DBSCAN聚类算法

绍磊leo

已于 2023-03-21 22:01:38 修改

阅读量324

点赞数 1

分类专栏： chatgpt 文章标签：算法聚类数据挖掘

于 2023-03-19 15:41:58 首次发布

本文链接：https://blog.csdn.net/m0_37340621/article/details/129651627

版权

chatgpt 专栏收录该内容

16 篇文章 1 订阅

订阅专栏

以下是简单的C++实现DBSCAN聚类算法的示例代码，供参考：

#include <iostream>
#include <vector>
#include <cmath>

double getDistance(std::vector<double> &p, std::vector<double> &q){
    double distance = 0.0;
    for (int i = 0; i < p.size(); i++){
        distance += pow(p[i] - q[i], 2);
    }
    return sqrt(distance);
}

std::vector<int> rangeQuery(std::vector<std::vector<double>> &dataset, int point, double eps){
    std::vector<int> neighborIndexes;
    for (int i = 0; i < dataset.size(); i++){
        if (getDistance(dataset[point], dataset[i]) <= eps){
            neighborIndexes.push_back(i);
        }
    }
    return neighborIndexes;
}

std::vector<std::vector<int>> DBSCAN(std::vector<std::vector<double>> &dataset, double eps, int minPoints){
    std::vector<std::vector<int>> clusters;
    std::vector<bool> visited(dataset.size(), false);
    std::vector<int> noise;

    for (int i = 0; i < dataset.size(); i++){
        if (!visited[i]){
            visited[i] = true;
            std::vector<int> neighbors = rangeQuery(dataset, i, eps);
            if (neighbors.size() < minPoints){
                noise.push_back(i);
            }else{
                std::vector<int> cluster;
                cluster.push_back(i);
                for (int j = 0; j < neighbors.size(); j++){
                    if (!visited[neighbors[j]]){
                        visited[neighbors[j]] = true;
                        std::vector<int> newNeighbors = rangeQuery(dataset, neighbors[j], eps);
                        if (newNeighbors.size() >= minPoints){
                            for (int k = 0; k < newNeighbors.size(); k++){
                                neighbors.push_back(newNeighbors[k]);
                            }
                        }
                    }
                    bool is_cluster_point = false;
                    for (int k = 0; k < cluster.size(); k++){
                        if (cluster[k] == neighbors[j]){
                            is_cluster_point = true;
                            break;
                        }
                    }
                    if (!is_cluster_point){
                        cluster.push_back(neighbors[j]);
                    }
                }
                clusters.push_back(cluster);
            }
        }
    }
    return clusters;
}

int main()
{
    std::vector<std::vector<double>> dataset = {{0.0, 0.0}, {1.0, 0.0}, {2.0, 0.0}, {0.0, 1.0}, {1.0, 1.0}, {5.0,5.0}};
    double eps = 1.0;
    int minPoints = 2;
    std::vector<std::vector<int>> clusters = DBSCAN(dataset, eps, minPoints);

    for (int i = 0; i < clusters.size(); i++){
        std::cout << "Cluster " << i << ": ";
        for (int j = 0; j < clusters[i].size(); j++){
            std::cout << clusters[i][j] << ", ";
        }
        std::cout << "\n";
    }

    return 0;
}

这个示例代码使用输入数据dataset、epsilon(eps)和minPoints作为参数，并返回聚类。其中，输入数据dataset是一个向量集合，每个向量表示一个n维数据点。

运行示例后，输出如下：

Cluster 0: 0, 1, 2, 
Cluster 1: 3, 4, 
Cluster 2: 5,

这些结果表明， DBSCAN算法成功地将坐标值小于1.0的数据点划分到簇0中，并将另外三个点分别分配给簇1和簇2。

绍磊leo

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【chatgpt代码系列】DBSCAN聚类算法

chatgpt生成的代码
复制链接

扫一扫

专栏目录

【chatgpt代码系列】DBSCAN聚类算法

“相关推荐”对你有帮助么？