机器学习概论聚类算法实现(实验四)

最新推荐文章于 2024-04-29 19:43:56 发布

乌卡拉卡乐乐子

最新推荐文章于 2024-04-29 19:43:56 发布

阅读量2k

点赞数 1

分类专栏：机器学习概论文章标签：机器学习算法聚类

本文链接：https://blog.csdn.net/le000426/article/details/121864240

版权

一、实验目的
1、熟悉使用numpy模块生成二维正态分布；
2、掌握kmeans聚类的代码实现；
3、熟悉numpy的使用；
4、熟悉matplotlib的使用。
二、实验设备
计算机：CPU四核i7 6700处理器；内存8G； SATA硬盘2TB硬盘； Intel芯片主板；集成声卡、千兆网卡、显卡； 20寸液晶显示器。
编译环境：python解释器、Pycharm编辑器
三、实验内容
1、新建项目和文件，并导入numpy和matplotlib
（1）打开Pycharm，新建项目，并在该项目下新建文件kmeans_clustering.py。
（2）导入一些编程中需要的包。

import numpy as np
import matplotlib.pyplot as plt
2、构造一个函数data_producer
（1）定义函数头data_producer，该函数有三个参数，miu，sigma，sample_no分别表示生成二维正态分布的均值，标准差和生成样本点的个数。
（2）调用numpy.random.multivariate_normal生成二维正态分布的数据。
（3）该函数返回生成的数据。```

```java

def data_producer(miu, sigma, sample_no):
    data = np.random.multivariate_normal(miu, sigma, sample_no)
    return data
``3、编写一个类KmeansClustering
（1）构造一个类KmeansClustering，并定义构造函数，需要数据集和kmeans算法中的k作为输入。
（2）定义类方法cluster，实现kmeans算法，并打印分类后的混淆矩阵，返回分类后的数据。`

```java
class KmeansClustering:
    def __init__(self, data, k, maxrenew):
        self.data = data
        self.k = k
        self.Sigma1 = None
        self.Sigma2 = None
        self.Sigma3 = None
        self.renew = 0
        self.maxrenew = maxrenew
    def cluster(self):
        a = []; iter = 0
        for i in range(self.k):
            x = np.random.randint(0, np.shape(self.data)[0])
            a.append(self.data[x])
        c = np.array(a)
        Old_d = np.copy(c)
        while(self.maxrenew <=1000):
            New_d = np.copy(Old_d)
            self.Sigma1 = []
            self.Sigma2 = []
            self.Sigma3 = []