c# c均值聚类及DBSCAN聚类

winform的界面搭建比较简单,首先在界面上的左边产生两堆特征值为 0-100的二维样本。通过 c均值聚类及DBSCAN聚类将聚类结果显示在右边。样本点有x和y值,用List<Point>存储一个类。

 

 

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Windows.Forms;
using System.Drawing.Text;


namespace PatternRecon
{
    public partial class Form1 : Form
    {
   
        public List<Point> Cluster1=new List<Point>();
        public List<Point> Cluster2=new List<Point>();

        public List<Point> afterCluster1 = new List<Point>();
        public List<Point> afterCluster2 = new List<Point>();

        public Form1()
        {
            InitializeComponent();
            InitCombo();
        }
        public void InitCombo()
        {
            this.comboBox1.Items.Add("c均值");
            this.comboBox1.Items.Add("DBSCAN");
            //设置默认值
            this.textBox1.Text = "1";
            this.textBox2.Text = "12";
            //设置背景
            afterCluster1.Clear();
            afterCluster2.Clear();
            this.pictureBox1.Image = (DrawCluster(afterCluster1, afterCluster2, false));
            this.pictureBox2.Image = (DrawCluster(afterCluster1, afterCluster2, false));
        }

        //产生随机数种子
        public static int GetRandomSeed()
        {
            byte[] bytes = new byte[4];
            System.Security.Cryptography.RNGCryptoServiceProvider rng = new System.Security.Cryptography.RNGCryptoServiceProvider();
            rng.GetBytes(bytes);
            return BitConverter.ToInt32(bytes, 0);
        }

        //产生标准正太分布
        public static double[] NormalDistribution()
        {
            Random rand = new Random(GetRandomSeed());
            double[] y;
            double u1, u2, v1=0, v2=0, s = 0, z1=0, z2=0;
            while (s > 1 || s == 0)
            {
                u1 = rand.NextDouble();
                u2 = rand.NextDouble();
                v1 = 2 * u1 - 1;
                v2 = 2 * u2 - 1;
                s = v1 * v1 + v2 * v2;
            }
            z1 = Math.Sqrt(-2 * Math.Log(s) / s) * v1;
            z2 = Math.Sqrt(-2 * Math.Log(s) / s) * v2;
            y = new double[] { z1, z2 };
            return y; //返回两个服从正态分布N(0,1)的随机数z0 和 z1
        }
        //确定
        private void button1_Click(object sender, EventArgs e)
        {
            if (this.comboBox1.Text == "c均值")
            {
                //调用c均值
                Caverage();
                this.pictureBox2.Image = (DrawCluster(afterCluster1, afterCluster2,false));
            }
            else if (this.comboBox1.Text == "DBSCAN")
            {
                //调用DBSCAN
                if (this.textBox1.Text == "" || this.textBox2.Text == "")
                {
                    MessageBox.Show("请输入DBSCAN值");
                }
                else
                {
                    DBSCAN();
                    this.pictureBox2.Image = (DrawCluster(afterCluster1, afterCluster2, false));
                }
            }
            else
            {
                MessageBox.Show("请选择聚类方法&#x
  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
K-means、系统层次聚类DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是常见的聚类方法,它们在算法原理和应用场景上有一些区别和联系。 1. K-means聚类: - 原理:K-means是一种基于距离的聚类方法,将数据集划分为K个簇,每个簇以其质心(簇中所有样本的均值)来表示。算法迭代地更新簇的质心,直到质心不再改变或达到预定的停止条件。 - 特点: - 需要事先指定簇的数量K。 - 对于高维数据和非凸形状的簇效果可能较差。 - 对噪声和异常值敏感。 - 适用场景:适用于数据集具有明显的簇结构、簇数已知或可估计的情况。 2. 系统层次聚类: - 原理:系统层次聚类是一种层次化的聚类方法,通过计算样本间的相似性构建一个层次结构。可以采用凝聚(自底向上)或分裂(自顶向下)策略。凝聚式方法从每个样本作为一个初始簇开始,逐步合并最接近的簇,直到达到停止条件。 - 特点: - 不需要预先指定簇的数量。 - 生成层次结构,可以根据需要选择合适的簇数。 - 对于离群点和噪声的鲁棒性较好。 - 适用场景:适用于数据集没有明显的簇结构、簇数不确定或希望在不同层次上进行分析的情况。 3. DBSCAN聚类: - 原理:DBSCAN是一种基于密度的聚类方法,通过定义样本点周围的密度来确定簇的边界。该算法将高密度区域看作是簇的一部分,可以自动识别任意形状的簇,并且能够识别噪声点。 - 特点: - 不需要预先指定簇的数量。 - 能够处理任意形状的簇,对噪声和异常值有较好的鲁棒性。 - 对参数设置(如半径和邻域密度)敏感。 - 适用场景:适用于数据集具有不规则形状、噪声较多或簇大小差异较大的情况。 联系: - K-means和系统层次聚类都是基于距离度量的方法,而DBSCAN是基于密度的方法。 - K-means和系统层次聚类需要预先指定簇的数量,而DBSCAN不需要。 - K-means和DBSCAN对噪声和异常值较为敏感,而系统层次聚类相对较为鲁棒。 - 系统层次聚类可以生成一个层次结构,而K-means和DBSCAN生成固定数量的簇。 总之,这三种聚类方法在原理和适用场景上有所区别,选择合适的方法取决于数据的特点和聚类的目标。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值