- 博客(5)
- 收藏
- 关注
原创 pytorch框架中的梯度反向传播
pytorch框架下的loss.backward()是机器学习代码中的重要部分,在最近的一个项目中需要提出模型中间量梯度进行处理,发现开源代码及网上的一些说法存在错误,并且".backward()"方法中有一些基础知识令人混淆,专门写了一个简单的模型测试了torch中的梯度反向传播过程。
2024-03-01 14:22:30 377
原创 CNN/Dailymail 数据集的三种处理方式
一份给NLP新手的cnn_dailymail数据集使用方式介绍,适用于huggingface的其他数据集
2023-08-25 20:35:07 1768 1
原创 神经网络(LSTM)中的变长序列处理及多GPU训练
个人写lstm为核心的算法时遇到的一些小问题的总结,主要是变长序列的处理,多GPU训练的使用,以及在使用多GPU训练时同时处理变长序列时遇到数据不能正常传入模型等问题。
2022-08-30 00:21:40 2383
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人