360实习
1.lstm结构
2.rnn梯度消失 梯度爆炸 短期依赖
3.除了kmeans还知道啥聚类算法
4.crf ;hmm原理
5.bert结构 和transformer区别:没用decoder等
6.self-attetion QKV的含义
58同城实习
1.数据不均衡怎么解决,数据增强
2.交叉熵和KL散度
3.Bert+crf;lstm+crf
4.hmm和crf区别
5.介绍transformer
6.多头自注意力机制
7.lstm 和gru区别
8.有做过文本匹配么?给你个句子,在库里的句子找到最相似的
9.对比学习了解么