- 博客(6)
- 收藏
- 关注
原创 创新点寻找
三四区=LSTM+Attention(变体、通道注意力、金字塔注意力、概率稀疏注意力)+posion embedding。三四区=Transformer+(attention+cnn+pool)+position embedding。组合创新=基准模型(Transformer,U-Net)+模块(Attention,GCN,CNN)论文2=Auto Encoder +时间卷积网络+扩散卷积+注意力。论文1=Transformer+线性注意力+因果卷积+扩散卷积。对模块进行微改、看起来具有创新的。
2023-10-14 15:13:45 83 1
原创 pytorch autograd
然后,我们执行了一系列操作,其中 y 是 x 的每个元素的两倍,z 是 y 的元素之和。因为 z 是一个标量(单个值),而 x 是一个包含多个元素的张量,所以 x 的梯度是一个与 x 具有相同形状的张量,其中每个元素都是 z 相对于相应元素的偏导数。在这个例子中,由于 z 是 x 的每个元素的两倍之和,所以 x 的每个元素对应的梯度都是 2。这个结果符合梯度的计算方式,即通过链式法则,对于一个标量目标函数,梯度是该函数相对于每个输入元素的偏导数的向量。
2023-10-02 11:33:08 105 1
原创 深度学习神经网络代码模板
train.py 文件用于加载数据集,创建模型实例,定义损失函数和优化器,并执行训练过程。在训练过程中,通过循环遍历每个 epoch 和每个批次,执行前向传播、计算损失、反向传播和参数更新。上述代码中的 train_data、train_targets、test_data 和 test_targets 是示例数据,你需要根据自己的实际情况替换它们。使用时,你可以在 train.py 或其他代码文件中导入 MyDataset 类,并创建数据集实例,然后传递给 DataLoader 以进行数据加载和批处理。
2023-07-07 17:52:40 321 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人