百度算法实习-二面

作者分享了在百度和淘天实习面试经历,重点围绕大模型技术,包括简历中提及的BERT模型改进、数据集处理策略(如商品标题分类和tokenizer)、大模型使用中的问题(如OOVtokenizer处理和停用词),以及手写multi_head_attention部分的简要描述。
摘要由CSDN通过智能技术生成
  • 1、自我介绍
  • 2、简历中论文对bert模型的一个改进
  • 3、简历中论文如何处理数据集的
  • 4、如何处理商品标题分类,标签数量多了有什么影响
  • 5、tokenizer有了解过吗,说一下bert的分词
  • 6、出现oov tokenizer是怎么处理的
  • 7、bert的缺点
  • 8、大模型为什么要使用停用词
  • 9、BBPE算法和BPE算法基本内容
  • coding:
  • 手写multi_head_attention

总结:

面试了很多实习,感觉百度和淘天的面试反馈结果是给的最快的。淘天面试完半个小时就会告诉面试是否通过。百度的一面和二面都是当天给的结果,所以体验还是很好的。因为岗位内容主要做的是大模型,所以问的是关于大模型的内容。手写的attention我没有写mask,还是怕有点麻烦,不过我觉得这代码就是用来背诵的。。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值