Pytorch学习笔记(2): 一维卷积, RNN, LSTM详解

最新推荐文章于 2024-07-13 18:01:13 发布

变量命名好难啊

最新推荐文章于 2024-07-13 18:01:13 发布

阅读量9.1k

点赞数 6

分类专栏：深度学习 Pytorch 文章标签： Conv1d RNN LSTM Pytorch

本文链接：https://blog.csdn.net/Alen_1996/article/details/92833176

版权

本文详细介绍了Pytorch中的一维卷积操作，包括参数解析与应用实例。接着深入讲解了RNN的结构、函数及范例代码，最后探讨了LSTM的内部工作机制，并提供了相关示例代码。通过实例展示了如何使用RNN和LSTM进行序列数据的学习和预测。

摘要由CSDN通过智能技术生成

一维卷积

torch.nn.Conv1d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode=‘zeros’)

这个函数用来对输入张量做一维卷积

in_channel和out_channel是卷积核个数
kernel_size是卷积核的大小
stride是卷积核移动步长, padding是否对输入张量补0

现在我有一个音频的梅尔频谱数据输入,一个batch为十张频谱, 一张频谱大小为129帧, 频率幅度为128,这个张量表示为(10, 128, 129),

import torch.nn as nn
import torch

input = torch.randn(10, 128, 129)
m = nn.Conv1d(128, 128, kernel_size=4, padding=2)
out = m(input)
print(out.size()) #(10, 128, 130)