实习面经
1.svm怎么划分,是硬划分还是软划分,怎么判断分值,为啥要用对偶,条件是什么,kkt条件
2.auc用过么 f1怎么算,带参数的f1知道吗
3.讲讲bert整个结构 训练任务都有啥(mask 下一句) 后续bert针对“下一句”任务的改进
4.讲讲transformers self-attention的Q K V是什么 编码和解码的区别(解码要mask)
5.用的什么激活(relu)好处是什么 self-attention除以n是干什么-标准化
6.讲w2v原理,怎么加速训练
7.relu函数是啥,relu变体
手撕:背包问题 把一个数组分为和相等的两部分
实习手撕
手撕:DP 由2 3 5 7乘出来的数 从小到大
手撕:消除ab 用栈 比如abcabbd —> cbd
手撕:岛屿数量
秋招 一面
1.你做项目遇到的比较困难的一件事
2.bert的预训练任务,你怎么看两个任务的作用?
3.albert sop
4.albert相对bert里面还有对参数量上的改进
https://blog.csdn.net/u010159842/article/details/102995704
5.bert里面多头 8变12头 参数量不变
6.Bert里面LN的作用,为什