WADI&SWAT数据处理

矢吹奈子超甜

已于 2023-08-27 13:19:36 修改

阅读量4.6k

点赞数 3

文章标签： python 机器学习开发语言

于 2023-03-28 14:32:24 首次发布

本文链接：https://blog.csdn.net/weixin_44048851/article/details/129814314

版权

该文段展示了如何使用Pandas库对WADI和SWAT数据集进行预处理，包括填充Nan值，应用滑动窗口平均策略，以及异常标签的设定和数据归一化。代码中涉及异常检测的关键步骤，如特征选择、数据清洗和标准化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

参考GDN的数据处理方式，每10条取平均值，标签为窗口内的多数值。

WADI

# import pandas as pd

train_new = pd.read_csv('D:/anomalydata/wadi/WADI.A2_19 Nov 2019/WADI_14days_new.csv')
test_new = pd.read_csv('D:/anomalydata/wadi/WADI.A2_19 Nov 2019/WADI_attackdataLABLE.csv', skiprows=1)

# test = pd.read_csv('D:/anomalydata/wadi/WADI.A1_9 Oct 2017/WADI_attackdata.csv')
# train = pd.read_csv('D:/anomalydata/wadi/WADI.A1_9 Oct 2017/WADI_14days.csv', skiprows=4)
# 这几列都是Nan值，直接赋值0
ncolumns = ['2_LS_001_AL', '2_LS_002_AL', '2_P_001_STATUS', '2_P_002_STATUS']
train_new[ncolumns]=0
test_new[ncolumns]=0

# test_new.columns
# 标签列1为异常-1正常修改为1异常0正常方便后续操作。
test_new.rename(columns={'Attack LABLE (1:No Attack, -1:Attack)':'label'},inplace=True)
test_new.loc[test_new['label'] == 1, 'label'] = 0
test_new.loc[test_new['label'] =&