针对于简历中会问到的问题
神经网络的高速磁浮轨道不平顺预估
-
为什么选择用cnn而不用rnn?双向rnn为什么不用
1.由于轨道不平顺在车辆激起的震动加速度具有双向性 2.由于磁浮列车在车体前后各有一个悬浮控制架,且车体是刚性的,因此远端的悬浮控制架的震动加速度同样会影响该侧的震动加速度,因此采用双向rnn也不是很合理,反而将其折叠后产生的更为合理一些
-
激活函数有哪些,为什么选用relu,一个激活函数应该具有哪些品质特征
sigmoid,tanh,选用relu主要是由于避免梯度消失,当然了深度在不深的情况下我认为也可以考虑sigmoid和tanh,因此我再后面两层的激活全部用的是自定义激活函数,目的是为了输出不局限于激活函数的值域范围内。激活函数的性质:可导,非线性,单调
-
Inception说一下,resnet说一下
-
数据增强说一下
-
pooling层的作用,cnn的反向传播是怎么操作的
-
bn和dropout在训练和测试的区别,两者的反向传播是怎么操作的
-
为什么选用rmse,还有哪些衡量指标
-
L2正则和L1正则的区别,权值衰减是怎么一回事,为什么权值衰减选用l2正则,因为l1容易产生稀疏解,导致不激活
-
小数据集下迁移学习是怎么回事,为什么不能够用迁移学习,现在小样本学习的方式有哪些
无人行风控模型的构建:
-
异常值点的检测有哪些方案,你采用了什么方案?
采用了3σ原则的方案,还有DBSCAN,boxplot,iforest
介绍一下DBSCAN和iforest
-
缺失值的填充的方案
众数填充,还有lagrange插值,knn(说一下knn)
-
xgboost的原理?xgboost和gbdt的区别?xgboost为什么比gbdt快?xgboost的并行化体现在什么步骤?boosting和bagging有什么区别
-
为什么树模型可以用来做重要性排序
-
FM的算法原理是什么?优化是怎么做的
-
介绍一下easyensemble,easyensemble为什么最后是bagging
-
介绍一下采样的方法主要有哪些
-
样本不均衡问题的度量指标,AUC,召回,F1score,为什么这三个不受不均衡的影响
-
常用的聚类方法有哪些,kmeans,DBSCAN,GMM,介绍一下这几个的区别,kmeans和DBSCAN的差异,GMM的前提假设,怎么操作的
-
为什么常用树模型做:
1.对异常值不敏感 2.内部有处理缺失值的方案(说一下有哪些方案) 3.可以用来同时处理数值型和类别性的数据,不用做one-hot产生稀疏矩阵 4.预测的时间复杂度较低
-
gbdt拟合当前的残差,当是离散值的时候是怎么处理的,说一下连续纸和离散值的距离度量方案
-
为什么金融风控很少采用深度学习
-
稀疏矩阵的处理方式?
1.降维 降维有哪些方法,PCA,LDA区别? 2.特征选择(特征选择的三个方法:过滤式,嵌入式和包裹式) 有什么区别