1.以下几种优化方法中,那种对超参数最不敏感?(C)
A.SGD(stochastic gradient descent) B.BGD(batch gradient descent) C.Adadelta D.Momentum
2.克莱姆法则是线性代数中一个关于求解线性方程组的定理。对一亿个具有N个方程,N个未知数的方程组,下列说法正确的是:(A、B)
A.当方程组的系数行列式不等于零时,则方程组一定有解;
B.如果方程组有两个不同的解,那么方程组的系数行列式必定等于零.
C.如果方程组的系数行列式等于零,那么方程组一定无解
D.当方程组的系数行列式不等于零时,则方程组可能有多组解.
3.快排的最佳情况时间复杂度 (O(nlogn))
4.同事小鹅在训练深度学习模型是发现训练集误差不断减小,测试集误差不断增大,以下解决方法错误的是: (B)
(过拟合怎么处理)
A.数据增强
B.增加网络深度 (减少)
C.提前停止训练
D.添加dropout
5.鞍点上的Hessian矩阵的描述哪个是正确的(不是正定,也不是负定,也不是半正定,而是零)(D)
鞍点即一个维度向上倾斜且另一维度向下倾斜的点,鞍点:梯度等于零,在其附近Hessian矩阵有正的和负的特征值,行列式小于0,即是不定的。
A.正定矩阵
B.负定矩阵
C.半正定矩阵
D.都不对
6.样本总体在区间[-1,1]上服从均匀分布,则样本X1,X2,…,Xn的样本均值E(X)和样本方差D(X)
均匀分布的数学期望和方差是:
E(x)=0,D(x)=1/3
7.设随机变量满足:E(X)=μ,D(X)=σ²,则由切比雪夫不等式,有P{|X-μ|>=4σ}<=(1/16)
8.分层抽样方法,在下面哪种情况下是比较合适的选择(B)
A.研究的总体非常小
B.在调研中希望了解不同子群体的差异
C.总体中只有一部分样本是可以调研的
D.没有先验的总体信息
9.冒泡排序对{5 7 0 9 2 3 1 4}进行从小到大排序,一共需要交换多少次 (17次)