前言
提示:故障数据属于无标签类型,要对这类型的数据进行一个分类,一般使用到无监督的方法,聚类属于一种无监督的算法,这里使用的也是较为简单的kmeans算法。
提示:以下是本篇文章正文内容,下面案例可供参考
一、Kmeans是什么?
在“无监督学习中”,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。其中,k-means(k均值)算法是其中一种非常著名地、较容易理解的算法,本次的案例使用的也是kmeans。具体数学推导原理,网上非常多的优秀介绍,在此只简单的演示一下代码。
二、使用步骤
1.引入库
代码如下(示例):
import matplotlib.pyplot as plt
import scipy.io as scio //一个可以处理.mat类型文件的库
from sklearn.cluster import KMeans // kmeans的库
import numpy as np
from sklearn.decomposition import PCA // 数据降维
2.读入数据
代码如下(示例):
dataFile_train = "../train_filename.mat"
dataFile_test = "../test_filename.mat"
data_1 = scio.loadmat(dataFile_train)
data_2 = scio.loadmat(dataFile_test)
//scio 加载后的数据是一个字典格式的数据,下面根据键值取出所需数据
Train_data