- 1、自我介绍
- 2、简历中论文对bert模型的一个改进
- 3、简历中论文如何处理数据集的
- 4、如何处理商品标题分类,标签数量多了有什么影响
- 5、tokenizer有了解过吗,说一下bert的分词
- 6、出现oov tokenizer是怎么处理的
- 7、bert的缺点
- 8、大模型为什么要使用停用词
- 9、BBPE算法和BPE算法基本内容
- coding:
- 手写multi_head_attention
总结:
面试了很多实习,感觉百度和淘天的面试反馈结果是给的最快的。淘天面试完半个小时就会告诉面试是否通过。百度的一面和二面都是当天给的结果,所以体验还是很好的。因为岗位内容主要做的是大模型,所以问的是关于大模型的内容。手写的attention我没有写mask,还是怕有点麻烦,不过我觉得这代码就是用来背诵的。。