从牛客摘抄
batchnorm的几个参数,能不能整合到前面的conv里,训练时和测试时的区别
卷积参数:权重W,偏置位B WX+B
BN层参数:均值mu,方差delta,缩放因子gamma,平移beta,一个分母防止为0的epsion
感受野计算
33,s=1与55,s=2的核在无限大(即不用考虑padding)的feature map上卷积计算的计算量之比
解释一下sgd的momentum
算法题:非常大的两个数组,一个是人的id(unique,无序),一个是浮点型身高值。一一对应。要求返回top m身高及对应的id。约束条件:1. 这m个身高和id的顺序必须是数组原状态的顺序。2. 空间复杂度O(1),时间不作要求。
softmax和cross entropy loss
交叉熵搭配softmax使用的损失函数
排序的空间复杂度
如何生成随机数
线性同余方法(LCG)是一种产生伪随机数的方法。