滴滴实习
1.聚类没有试过表示学习的方法么?说了sentenceBert,说这个老了有几年了
2.gbdt训练目标 负梯度
3.gbdt loss为mse的时候拟合的是残差
4.gbdt 和梯度下降的区别和联系?
5.xgboost相对于gbdt的改进,有个采样没说
6.自注意力怎么算的
7.高斯混合聚类
https://blog.csdn.net/lotusng/article/details/79990724
8.crf推理过程 维特比
手撕:最小编辑距离
美团实习
1.T5和传统transformer的改进
2.T5 mask的区别
3.Bert基于mask的调优 有跟进吗
4.bert nsp做什么效果好 什么效果不好
5.sentence bert做语义相似度优势原理,bert丢失整句语义,sentence bert解决模型塌缩,原理?
6.w2v两种方式性能差别
7.transformer用残差了么
8.残差的作用
9.多轮对话需要怎么做
10.一般的对话和场景对话区别
·手撕:给词表,一个文本,输出所有分词可能
·手撕:给n求开方 二分查找