算法岗NLP实习面经

算法岗NLP实习面经

众所周知,算法岗招聘已经趋于冷静,越来越考察一个人基本功而早已不再有以往临时抱佛脚就能收到offer情况。受疫情影响和开题答辩以及一些个人原因,本想春招投实习简历计划作罢,个人安排受到很大影响。因此直到5月底才开始陆续投简历,而春招实习岗很多大厂基本都已招完,因而时间紧任务紧迫,压力不可谓不小。经过目前近一个月投递反馈,还仍有很多需要改进,在此记录下来以便更好改进。

6.9科大讯飞(HR面)

HR打电话了解了一下实习情况后,后面一直没有消息,凉凉

从5月底到6月中旬在准备开题相关,只是试探性投了一些,因为简历写得不好,导致几乎投了没有反应。由此可见,好好写简历非常重要!在针对性修改后收到了一些笔试和面试。

6.19购物狗(笔试)

当天投简历就收到了笔试通知,但是了解到实习内容基本是和文本预处理有关,和目前想做内容不太匹配,而且笔试完后也没后续。笔试题出了7-8道编程题.,都是在电商场景下解决一些具体问题。题目总体而言还是有一定难度,题量较大,给我感觉这不是实习笔试更象校招题目。

  1. 写一个正则表达式表示浮点数数字,且不能表示整数
  2. 有大量商品和用户使用记录表格,编程实现建立统计商品用户使用索引,并且(1)按格式为{‘商品’,用户ID1,用户ID2}输出(2)计算购买最多N个商品(不太记得了)
  3. 给定一个字符串,TF-IDF计算及编程(这道题出的有问题,一个字符串不能统计IDF)
  4. 相似度计算方法有哪些
  5. 选择一种相似度计算方法编程实现
  6. 编程实现计算商品促销折扣后理论价格,以及这些方法缺点和改进
  7. 如何实现贝叶斯定理及单词拼写纠错
  8. 推荐系统大量数据下文本处理(记不太清楚了,当时没时间做完)

经验和教训
第7、8题还是有一定难度的,笔试整体题量较大,如果要答完有难度,但是也暴露了自己基础不够牢缺点。

6.21恒生电子(笔试)

恒生电子实验性质招算法实习生,只有5个名额。还是总共算法岗名额,NLP估计就1-2个吧,面试群里有2000人满,实际面试所有岗位总人数估计有几千甚至上万人,激烈程度可想而知。
笔试题出的很奇怪,大部分是选择题,而且行测逻辑题竟然占了1/3,更奇葩的是,一些行测逻辑题出题有问题,问题描述都没写就选答案了。。1/3考察数学基础和机器学习基础,1/3考察NLP相关和(编程题编程题竟然只有一道)。

  • 数学和机器学习基础
    选择题形式考察。一部分问一些统计概率和高数问题,有一些题很久不看不怎么记得了,比较基础。另一部分机器学习基础问的比较奇怪,比如凸集概念。。
  • 行测逻辑题
    选择题形式考察。问题又多又长,差点以为自己考公了,有些题竟然问题描述都不写就给选了,这怎么答?(当时看得我一脸懵)
  • 深度学习与NLP
    选择题:CNN图片输入输出格式大小,HMM、CRF三大问题及使用方法等。
    编程题:冒泡排序
    大题:
    • 实体消歧模型设计。我使用bert模型
    • HMM、CRF三大问题及使用方法
    • (还有一题忘了)

后面待更

6.22 字节跳动(内推)

6.26-27交叉科技(笔试)

6.28差评(面试)

聊了近20分钟,感觉还挺有戏,然被拒。对于公司工作内容了解不够多,有些问题回答不够好。

  • 介绍下自己 面试官说工作时主要处理没有标记数据——当时我没有回应,可以回复面试官考虑用聚类算法 说下bert模型 bert有哪些缺点

  • 用bert文本分类数据集大小

  • 在使用bert时遇到了什么困难——回答不够详细 RNN和CNN提取特征有哪些区别

  • 两个数据集相似程度很高,样本不大时如何进行分类——没答好

  • 对主题模型是否了解

  • 是否做过情感分析项目——回答没有(估计是导致面试不过原因) 了解公司主要做什么吗?不是很了解,回答的不好

  • 文本分类处理流程(预处理这块确实用得较少,主要流程回答也不够详细,应尽可能回答详细) 文本分类应该提取什么特征——答得一般

  • 了解公司主要做什么吗?不是很了解,回答的不好

6.26-6.27交叉科技(笔试)

笔试分为智力题、数学基础机器学习基础和编程题,各两个小时。HR挺好说话的,可以分开时间答题。

6.26 笔试一 智力题、数学基础、机器学习和深度学习

笔试有一定难度,在数学基础题和智力题上面花了较多时间导致后面机器学习和深度学习部分不够时间答题。题目出得比较好,特别是机器学习和深度学习部分都是许多公司常考知识,做完后值得进一步复习查缺补漏。

6.27 笔试二 编程题

题目比较难,2个小时有6道编程题,2道题是动态规划求最佳路径,2道题是求最长自重复子串和最长自重复子序列(后面看了知道需要使用字符串后缀匹配算法),我直接使用暴力算法,不过DEBUG一直没调试好。另两道一道求十进制与八进制转换,一道题求图连通分量个数。对于十进制与八进制转换题目基本没练过,二进制,八进制转换知识基本忘了。。所以没有写。求图连通分量个数题比较偏,也PASS了。

7.3子午智汇(面试)

已拿offer
面试官不是做NLP的,所以问的问题都比较基础。

7.5交叉科技(一面)

过了几天还以为凉了,7月3日问了面试官说公司赶项目比较忙所以没有安排面试,后面约了5号面试。

7.7贪心科技(面试)

7.8交叉科技(二面)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值