字节跳动算法 提前批offer复盘

作者 | zjwang

来源 | 见文末『阅读原文』处

整理 | NewBeeNLP公众号

写在前面

  • 北航本硕,非科班

  • 对搜索推荐比较感兴趣,平时看的文章比较多,所以聊的比较偏这一块

  • 大四时一段五个月的nlp方向实习,主要做基础embedding

一面

  • 主要是问之前实习经历

  • 涉及的模型/算法 包括

  • word2vec、lda/plsa、ELMo、n-gram比较基础

  • fm、gbdt+lr、ffm/afm/deepfm这些特征模型

  • 爬虫、qps多少

  • hmm分词、前后向最大匹配

  • 字典树

  • 算法题:给定一个数组和一个整数k,判断数组能否被分为多个和为k的子数组

P.S. 回溯法,写得不好,很乱,以为没后续了

二面

涉及到我自己的项目,问到了:

  • RL基本部件、Q-learning、policy gradient

  • double DQN、priority reply、reply buffer

还有一些比较基础的内容:

  • 过拟合/欠拟合

  • xgboost和gbdt的区别(答得不好,没准备过)

  • id3信息增益、c4.5信息增益比、c&rt的gini系数

  • C&RT回归树

  • 数据不平衡,auc和pr曲线如何选(这个选roc,pr相对来说不稳)

  • auc和pr在推荐之中的偏好(auc偏向于降低推荐用户不喜欢的内容,pr偏向于提高推荐用户喜欢的内容)

  • 协同过滤、冷启动、推荐的多样性(基于用户)

  • ridge regression和lasso regression

  • L2正则化的表示定理、kernel

  • LSTM

  • Kmeans、GMM、pLSA的EM算法

  • svd、pca、lda

  • 伪随机数线性同余

  • BERT(我只用过ELMo)

  • 函数变换采样、重要性重采样(RL的off-policy的思想)、接受拒绝采样

  • gibbs sampling、马氏链的细致平稳条件

算法题

  • 股票价格 leetcode那个

  • 给定一个数组,拼接一个最大的数(会溢出,用字符串做)

P.S. 这一面问了好多基础的ML算法,其实都不难,细心复习一遍就可以了,我答的比较磕巴

技术终面

一直以为字节是四面,hr打电话直接通知是技术终面了,给我紧张的要死????,那天下午连面腾讯、字节跳动、百度三家,心累了

三面应该是交叉面,面试官不太懂我做的方向,不过人很好,看二面同学问的很详细了,就重复强调问了下细节,这里就不细展开了

算法题

  • 城市模型leetcode 807,给水平、侧面的视图(最高高度),问最大体积是多少
    没做过啊,O(n^2)去取交叉最小值,问可不可以优化,可以先做排序,然后每次去除最小的一行或一列O(nlgn)

END -

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值