基于SVM的航空发动机故障诊断系统设计

Shining0596

已于 2022-11-21 21:04:29 修改

阅读量3.1k

点赞数 2

分类专栏：学习数据挖掘机器学习文章标签：其他学习数据挖掘

于 2022-11-21 21:04:06 首次发布

本文链接：https://blog.csdn.net/m0_58153897/article/details/127972339

版权

学习同时被 3 个专栏收录

97 篇文章

订阅专栏

机器学习

25 篇文章

订阅专栏

数据挖掘

21 篇文章

订阅专栏

第1关：准备实验数据

任务描述：

本关任务：补充数据准备模块代码，应用Panads模块，生成训练数据集。读取航空发动机模拟数据，每个发动机的第一条数据为正常状态数据，最后一条数据为故障状态数据，共有4个故障状态，分别为1，2，3，4，正常状态label为0

编程要求：

根据提示，在右侧编辑器补充代码，计算并输出数据集合的尺寸shape。

测试说明：

预期输出： (2832, 26)

import os
import pandas as pd
import pickle
import numpy as np
import os
data_path =r'data/'
#将每个发动机的第一行数据作为正常样本，最后一行作为故障样本
def get_local_data(data):
    data_extract = data.iloc[:, 0:26]
    list = data_extract['NO'].unique()
    data_norm = pd.DataFrame()
    data_x = pd.DataFrame()
    for i in list:
    #**********Begin**********#
    #第一步 进行数据读取 在两个空内分别填入切片索引
        df_first = data_extract[data_extract.NO == i].iloc[0]#此处填入切片索引
        df_last = data_extract[data_extract.NO == i].iloc[-1]#此处填入切片索引
        data_norm = data_norm.append(df_first, ignore_index=True)
        data_x = data_x.append(df_last, ignore_index=True)
    #**********End**********#
    return data_norm,data_x
#读取csv数据文件
def get_data(tag="labeled"):
    data_norm = pd.DataFrame()
    for root, _, files in os.walk(data_path):
        for file in files:
            if 'txt' not in file:
                continue
        #**********Begin**********#
        #第二步 读取csv数据文件 在空内填入文件路径，并设置数据读取间隔
            data = pd.read_csv(data_path+file, sep=' ') #此处填写read_csv函数，用于读取csv文件，数据间隔为' '
        #**********End**********#
            if "001" in file:
                data_norm_1,data_1 = get_local_data(data)
            if "002" in file:
                data_norm_2,data_2 = get_local_data(data)
            if "003" in file:
                data_norm_3,data_3 = get_local_data(data)
            if "004" in file:
                data_norm_4,data_4 = get_local_data(data)
            if "111" in file:
                data_norm_5,data_11 = get_local_data(data)
            if "222" in file:
                data_norm_6,data_22 = get_local_data(data)
            if "333" in file:
                data_norm_7,data_33 = get_local_data(data)
            if "444" in file:
                data_norm_8,data_44 = get_local_data(data)
    data_norm = data_norm.append([data_norm_1,data_norm_2,data_norm_3,data_norm_4,data_norm_5,data_norm_6,data_norm_7,data_norm_8],ignore_index=True)
    data_1 = data_1.append(data_11,ignore_index=True)
    data_2 = data_2.append(data_22, ignore_index=True)
    data_3 = data_3.append(data_33, ignore_index=True)
    data_4 = data_4.append(data_44, ignore_index=True)
    return data_norm, data_1,data_2,data_3,data_4

def  get_numpy_data(data):
    data = data.iloc[:,1:-1]
    #print(data.describe())
    #print(data.head())
    return np.array(data)

#错误类
class LABEL(object):
    NL = 0
    FE = 1
    FF = 2
    HE = 3
    HF = 4

def run():
    data_norm, data_1,data_2,data_3,data_4= get_data()
    normal,fault_1,  fault_2, fault_3,fault_4 = [LABEL.NL]*data_norm.shape[0],[LABEL.FE]*data_1.shape[0],\
                                                [LABEL.FF]*data_2.shape[0],[LABEL.HE]*data_3.shape[0],[LABEL.HF]*data_4.shape[0]

    labels = normal+fault_1+fault_2+fault_3+fault_4

    labels = np.array(labels)
    labels = np.array(labels > 0).astype(np.int)

    data_select = data_norm.append([data_1,data_2,data_3,data_4])
    data_select_array = get_numpy_data(data_select)

    jsj_data_file = data_path +'jsj_data.pkl'

    jsj_data = open(jsj_data_file, 'wb')
    #**********Begin**********#
    #第三步 pickle保存数据   在空内填入保存参数
    pickle.dump(data_select_array,jsj_data)            #填入参数以保存data_select数据
    pickle.dump(labels,jsj_data)            #填入参数保存labels数据
    #**********End**********#
    jsj_data.close()

if __name__ == "__main__":
    run()

第二关：数据预处理

任务描述：

本关任务：要求对第一关获取的数据进行数据预处理，包括数据标准化与主成分分析降维。

编程要求：

根据提示，在右侧编辑器补充代码，完成实验任务。

from sklearn.preprocessing import StandardScaler
import pickle
from sklearn.decomposition import PCA
import os
data_path =r'data/'
def Stage_2():
    #**********Begin**********#
    #第一步 读取Stage_1保存的数据文件，在空内填入保存参数
    f = open(data_path+'jsj_data.pkl','rb')#填空，按照字节读取pkl数据
    data = pickle.load( f) #填空获取训练数据
    labels = pickle.load(f )#填空获取标签
    #**********End**********#
    f.close()

    #**********Begin**********#
    #第二步 进行数据归一化处理，在空内填入参数
    normalizer = StandardScaler().fit(data)  # 数据归一化
    data_scale = normalizer.transform(data )     #填空，对数据进行归一化，得到data_scale
    pca = PCA(n_components= 21)                 #填空，确定PCA参数
    #**********End**********#
    #**********Begin**********#
    #第三步 进行数据PCA，在空内填入参数
    data_PCA = pca.fit_transform(data_scale)  #填入参数
    #**********End**********#
    jsj_data_file = data_path +'data_pca.pkl'

    jsj_data = open(jsj_data_file, 'wb')
    pickle.dump(data_PCA,jsj_data)
    pickle.dump(labels,jsj_data)
    jsj_data.close()

第三关：SVM模型训练

任务描述：

本关任务：训练SVM并进行测试。

编程要求：

根据提示，在右侧编辑器补充代码，完成实验任务。

import pickle
from sklearn.svm import SVC
from sklearn.model_selection import train_test_split
import os
data_path =r'data/data_pca.pkl'

def Stage_3_1():
    f = open('data/data_pca.pkl','rb')#按照字节读取pkl数据
    data_PCA = pickle.load(f) #获取训练数据
    labels = pickle.load(f)#获取标签
    f.close()
    #**********Begin**********#
    #第一步 分割数据集
    trainX, testX, trainY, testY = train_test_split(data_PCA, labels, test_size=0.1, random_state=42) #填空，将数据集分为测试样本与训练样本，分割度为10%
    #**********End**********#
    return trainX, testX, trainY, testY
def Stage_3_2(trainX,trainY):
    #**********Begin**********#
    #第二步 进行SVM模型设置并训练
    clf = SVC(probability=True)                       #填空，构建SVM模型
    clf.fit(trainX,trainY)                         #填空，进行SVM模型训练，以trainX为训练样本集，trainY为训练样本标签
    #**********End**********#
    return clf