自然语言处理面经

20210412

自我介绍。
挑选一个自己比较熟悉的项目讲解。
纠错你是怎么做的?
LR与gbdt的区别,什么情况下使用lr更好?
fasttext和word2vec的区别?words2vec的两种模型cbow和skip-gram哪一个模型对于低频词更友好?(skip-gram对低频词更友好)
k个翻转链表。
给出n个新闻事件,如何从这n个事件中找到和当前事件最相似的,设计你的算法?(事件抽取+倒排索引)

还是得踏实的刷题,复习,归纳整理。

20210421

自我介绍。
视频标签项目。
说一下gbdt,rf,xgboost三者的区别。gbdt中的决策树可以用其他的算法来代替吗,比如逻辑回归或者线性回归?逻辑回归的损失函数可以换成最小二乘吗?
过拟合的处理方法有哪些?(数据、模型、dropout、l1 l2正则),详细说一下L1\L2正则及其区别?
极大似然是基于什么分布的?
bert的结构?lstm结构?
cnn和dnn的区别,cnn为什么具有平移不变性。
了解哪些时间序列的算法?
他们部门是做高德打车的。派单、供需预测、风控、用户增长、交易。

20210423

  1. 计算编辑距离
    给你两个单词 word1 和 word2,请你计算出将 word1 转换成 word2 所使用的最少操作数 。你可以对一个单词进行如下三种操作:插入一个字符,删除一个字符,替换一个字符。

20210425

  1. 设计一个情感分析的流程,不使用正负极词典,可以提取哪些特征?流程(模型,数据,评价方法)。如果预测偏向正样本会由什么原因导致?怎么解决?(样本不均匀,batch ,loss加惩罚项)
  2. fasttext原理?与word2vec的区别?fasttext是怎么处理不等长的文本?(直接相加求平均)
  3. 你的模型是怎么用于线上评估的?post与get的区别?
  4. 一句话概括随机梯度下降法和牛顿法的区别?这两个方法哪一个更快?(听了面试官的答案之后,应该是想问哪一个更稳)
  5. 为什么换工作?

我的提问环节:
为什么没问我transformer?(感觉是在给自己挖坑)。面试官就问了我几句,bert为什么只是用了transformer encoding部分,了解gpt么?汗
团队主要是做什么的?地址解析的
团队目前的规模有多大?30

20210428

bert结构
HMM和CRF的区别?
xgboos和rf的区别?
极大似然估计的原理?
降维算法?
凸函数?
最短路径
数据库事务处理机制
整体问得特别基础。

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值