一、输入特征图格式121*121*3,卷积核为15核9*9,无零填充,步长为2
1.卷积操作后的图片格式
2.参数总量
3.cnn特点
二、1.自注意力机制qkv模式结构图
2.自注意力计算过程(缩放点积)
三、1.从梯度估计修正方面解释动量法和Nesterov加速梯度
2.高低维空间非凸优化问题的难点和侧重点
四、免费午餐定理和丑小鸭定理
五、描述随机梯度下降法,并分析优缺点
六、LSTM作为RNN的改进,能否有效控制梯度爆炸/消失,分析背后原理
七、深度强化学习五要素,提供一种较为合适的学习算法最大化累计收益