机器学习中val_小波变换(七):小波变换在机器学习中的应用(下)

本文继续讲解一篇关于小波变换在机器学习中的应用的博客: 《A guide for using the Wavelet Transform in Machine Learning》,极力推荐!! 3.1 使用连续小波变换可视化状态空间

1维信号的小波变换是2维的时间-尺度图,该图给出了系统状态空间的详细信息,也就是给出了系统的动态行为。

下图给出了El Nino数据集的原始时间序列信号、傅里叶变换和小波变换的结果。

f01630d20e834cc08ecff6a117b3c319.png

3.2 使用连续小波变换和卷积神经网络进行信号的分类

由3.1部分的2维时间-尺度图可知:小波变换不仅可以更好地理解系统的动态行为,也可以被用来区分不同类型的信号。测试所用的数据集包含了人做6种不同的活动。

3.2.1 加载UCI-HAR时间序列数据集

对于数据集的描述如下:包含人做6种不同的活动,一共10000多个信号,每个信号包含如下图的9个分量。

339245982cf27f7a60edf7ff8c01d0dc.png

由于每个信号包含9个分量,因此需要对每个信号进行9次连续小波变换。

56b7d9c1a1f7d942a17b52864f983bdd.png

按照7:3的比例划分所有信号,每个信号包含9个分量,每个分量包含128个样本点。因此,训练集的大小为(7352,128,9),测试集的大小为(2947,128,9)。 3.2.2 对数据集应用连续小波变换,并且将数据变换到合适的格式

既然每条信号对应9张时间-尺度图,该怎么把它们输入到CNN中呢?有如下四种可选的方案:

1)为每个分量分别训练CNN,最终的结果通过集成方式确定。这个方法可能性能较差,因为它忽略了不同分量之间的联系;2)先将9个分量的时间序列信号串联起来,然后对串联信号做连续小波变换。这种方法会在信号拼接的地方不连续,进而在时间-尺度图上信号拼接处产生造成噪声。3)首先计算每个分量的连续小波变换,然后将9个不同分量的时间-尺度图拼接成一张大的,再输入到CNN中。但是该方法同样也会在拼接处不连续,从而将噪声引入到CNN中。如果CNN足够深,也许可以区分出这些噪声。 4)将9个不同分量的时间-尺度图纵向摞在一起,形成一张通道数为9的图片,再输入到CNN中训练,如下图所示。

93e1f457cb0fc5dcdf58ea3620e90959.png

scales = range(1,128)waveletname = 'morl'train_size = 5000test_size= 500 train_data_cwt = np.ndarray(shape=(train_size, 127, 127, 9)) for ii in range(0,train_size):    if ii % 1000 == 0:        print(ii)    for jj in range(0,9):        signal = uci_har_signals_train[ii, :, jj]        coeff, freq = pywt.cwt(signal, scales, waveletname, 1)        coeff_ = coeff[:,:127]        train_data_cwt[ii, :, :, jj] = coeff_ test_data_cwt = np.ndarray(shape=(test_size, 127, 127, 9))f
  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值