机器学习
江畔初月夜
江畔何人初见月,江月何年初照人。
展开
-
双向LSTM or GRU(BiLSTM or BiGRU)的输出问题
先上结论:output保存了最后一层,每个time step的输出h,如果是双向LSTM,每个time step的输出h = [h正向, h逆向] (同一个time step的正向和逆向的h连接起来)。 h_n保存了每一层,最后一个time step的输出h,如果是双向LSTM,单独保存前向和后向的最后一个time step的输出h。 c_n与h_n一致,只是它保存的是c的值。详细请见连...原创 2019-12-04 09:13:46 · 4887 阅读 · 0 评论 -
深入理解FPN
这篇论文是CVPR2017年的文章,采用特征金字塔做目标检测,有许多亮点,特来分享。论文:feature pyrami...转载 2019-07-18 11:36:30 · 691 阅读 · 0 评论 -
CUDA和cuDNN的详细配置
版权声明:本文为博主原创文章,...转载 2019-08-13 09:47:47 · 1785 阅读 · 0 评论 -
pytorch实现不同网络层分配不同的学习率
在实际项目中,对于一个神经网络我们一般不会完全从零开始训练一个神经络,而是采用一些预训练模型作为我们网络的初始参数,甚至直接拿过来作为主干网络,然后经过fine-tuning即可完成对我们网络的训练。而对网络的fine-tuning大致分为三种:第一种:预训练模型的参数比较适合我们的数据集,我们只需要对新添加的网络层进行训练即可;这时候可以通过pytorch将预训练模型的梯度冻结,训练过程...原创 2019-08-26 15:50:39 · 931 阅读 · 0 评论