title:机器学习算法
一面:
https://blog.csdn.net/weixin_42486139/article/details/111841428
1.Tensorflow如何输出某一层卷积结果?
tf.Print
2.bagging 与boosting区别
3.分类网络常用backbone
https://blog.csdn.net/m0_59787404/article/details/121458616
主干网络,用来做特征提取的网络,代表网络的一部分,一般是用于前端提取图片信息,生成特征图feature map,供后面的网络使用。通常用VGGNet还有你说的Resnet,因为这些backbone特征提取能力是很强,并且可以加载官方在大型数据集(Pascal 、Imagenet)上训练好的模型参数,然后接自己的网络,进行微调finetune即可。
4.python 中 if name == ‘main’ 作用
在python的类中没有真正的私有属性或方法,没有真正的私有化。
但为了编程的需要,我们常常需要区分私有方法和共有方法以方便管理和调用。那么在Python中如何做呢?
一般Python约定加了下划线 _ 的属性和方法为私有方法或属性,以提示该属性和方法不应在外部调用,也不会被from ModuleA import * 导入。如果真的调用了也不会出错,但不符合规范。
https://www.jb51.net/article/160280.htm
一个python文件通常有两种使用方法,第一是作为脚本直接执行,第二是 import 到其他的 python 脚本中被调用(模块重用)执行。因此 if name == ‘main’: 的作用就是控制这两种情况执行代码的过程,在 if name == ‘main’: 下的代码只有在第一种情况下(即文件作为脚本直接执行)才会被执行,而 import 到其他脚本中是不会被执行的。
https://blog.csdn.net/heqiang525/article/details/89879056
5.介绍python垃圾回收机制
https://www.cnblogs.com/pinganzi/p/6646742.html
6.权重衰减的作用
权重衰减 即l2正则, 使学到的模型参数值尽可能小,增加模型鲁棒性,解决过拟合
7.介绍k-means流程,实现k-means更新簇的过程叫什么算法?
流程:略(面试高频问题,不清楚的自行百度)
算法名称:最大期望算法 EM
https://ac.nowcoder.com/discuss/817777
8.数据库三大范式
第一范式(1NF):列不可再分
第二范式(2NF)属性完全依赖于主键
第三范式(3NF)属性不依赖于其它非主属性 属性直接依赖于主键
9.mysql中给查询语句分组用哪个关键字
group by
10.时序算法有哪些:
https://blog.csdn.net/yunqiinsight/article/details/79741483
方法 1 –以简单的方式开始
方法2 – 简单平均数
方法3 – 移动平均数
方法 4 –指数平滑法
方法5 – Holt线性趋势法
方法6 – Holt冬季季节法
方法7 –综合自回归移动平均法(ARIMA)
https://zhuanlan.zhihu.com/p/67832773
1.时间序列基本规则法-周期因子法
2.线性回归-利用时间特征做线性回归
3.传统时序建模方法,ARMA/ARIMA等线性模型
4.时间序列分解,使用加法模型或乘法模型将原始序列拆分为4部分:长期趋势变动T、季节变动S(显式周期,固定幅度、长度的周期波动)、循环变动C(隐式周期,周期长不具严格规则的波动)和不规则变动I。
5.特征工程着手,时间滑窗改变数据的组织方式,使用xgboost/LSTM模型/时间卷积网络等
6. 转化为监督学习数据集,使用xgboot/LSTM模型/时间卷积网络/seq2seq(attention_based_model)。
7. Facebook-prophet,类似于STL分解思路,在控制程度和可解释性上比传统时序模型更有优势
8.深度学习网络,结合CNN+RNN+Attention,作用各不相同互相配合。
9.将时间序列转化为图像,再应用基于卷积神经网络的模型做分析
11.解释算法原理:kmeans,EM,LSTM,SVM, ARIMA
二面coding:
1.1695. 删除子数组的最大得分
https://leetcode-cn.com/problems/maximum-erasure-value/
2.200. 岛屿数量
https://leetcode-cn.com/problems/number-of-islands/
3.判断一棵树是另一颗树的子树
https://blog.csdn.net/wjl_zyl_1314/article/details/105036333
4.编程题:实现求根函数,有没有效率更高的方法。
5.编程题:用堆求前k大
6.编程题:0,1组成的n*m表格,一个人站在起始点,这个人只能经过与他脚底数字相同的地方(只有上下左右四个方向),输出这个人所有可以走到的点。
三面leader:
1.
介绍项目,介绍项目亮点,深挖项目中用到的network。
举例:任务中用到HED,ok,面试官问HED是如何解决正负样本不平衡的问题的?损失函数使用类平衡交叉熵。类平衡交叉熵的动态系数阿尔法是怎么得到的?除了类平衡交叉熵还有哪些解决正负样本不均衡的损失函数?focal loss。解释focal loss中的alpha系数、gamma系数,以及他们的作用,以及他们是如何起到作用的。这种解决正负样本不均衡的方式和OHEM的区别是什么?
bn在哪种情况下会出问题?听说过gn吗? bn在batchsize=1的时候效果不好, gn group normalization
2.介绍一篇最近看的好的技术文章