面试总结
qq_28935065
仰望星空,脚踏实地
展开
-
如何开始学术研究?
说起来,这个问题应该是上研究生之前,或者正在上研究生的时候应该去搞明白的问题,但是一直到毕业多年了,都还没有弄清楚过这个问题。直到现在才真正知道做学术研究的方法论。首先,成为一个研究生之后,都有一个指导老师来带研究生,每一个导师都会有具体的研究方向,或者研究的领域,如果就沿着导师所研究的领域做,那么已经有了一个大方向。如果不想沿着导师所研究的领域去做,那么就需要自己去找感兴趣的方向。其次,有了大方向之后,就要去寻找该大方向下,学者们都在研究什么问题/解决什么问题。确定了大家都在研究的问题之后,就原创 2022-02-18 17:47:02 · 337 阅读 · 0 评论 -
BERT基本原理是什么?
最近面试经常会被面试官问起,谈谈你对BERT的理解?你了解BERT吗?简单介绍一下BERT吧。虽然自己大概理解BERT的原理,但是表达的时候思路不够清晰 ,给面试官的感觉是似懂非懂,借此机会,想梳理一下应该怎么去表达,思路更清晰一些。大概的框架是:模型来源(提出北京)+名词解释+核心内容+模型效果+与之前模型的对比。BERT来源于Google的一篇名叫“pre-train of deep bidirectional transformer for langgue understanding”的论文,BE原创 2021-09-10 22:18:54 · 239 阅读 · 0 评论 -
BERT 中wordPiece的原理
1.为什么使用wordPiece?在BERT中,做数据预处理的时候,使用了wordPiece,所谓的wordPiece其实是把word再进一步的拆分,拆分为piece,得到更细粒度。而为什么使用wordPiece 而不直接使用word?比如如"loved","loving","loves"这三个单词。其实本身的语义都是“爱”的意思,但是如果我们以单词为单位,那它们就算作是不一样的词,在英语中不同后缀的词非常的多,就会使得词表变的很大,训练速度变慢,训练的效果也不是太好。2.wordPiece的实现算转载 2021-08-03 18:18:23 · 1937 阅读 · 0 评论 -
logistics回归学习过程推导
原创 2018-11-11 13:03:41 · 309 阅读 · 0 评论 -
面试现场写代码注意事项
1.拿到题目先不要急着写代码,先把问题弄明白,把可能的输入用例考虑清楚2.全面考虑输入用例的情况,代码不仅要能实现基本的功能,还要考虑如边界条件、特殊处理(如空指针,空字符串等)、错误处理等。3.写出代码自己在心里要执行一遍,确认没有问题再给面试官检查。4.考虑时间和空间复杂度。尤其是当一个问题有多个解决方案时...原创 2018-11-12 15:07:05 · 1583 阅读 · 0 评论 -
睿智合创(北京)科技有限公司数据分析笔试——部分笔试题(附答案)
1.删除重复数据import pandas as pdframe=pd.DataFrame({"C1":['one','two']*2+['two'],"C2":[1,1,2,3,3]})dele_dup=frame.drop_duplicates()frame..drop_duplicates(inpalce=True)注:主要考察DataFrame的drop_d...原创 2018-11-19 21:38:43 · 5767 阅读 · 0 评论