面试收藏

 题目汇总
笔试题
在互联网分析中,通常会关注用户的【第N日激活率】来衡量用户质量。用户的第N日激活指的是用户在注册的第N天登录网站或App,即算为该用户的第N日激活。第N日激活率指的是某日注册用户在第N天激活的数量除以该日所有注册用户数量
“赤兔”是领英中国针对中国职场人士推出的一款本土化的社交应用。如果你是领英中国的数据分析师,你会从哪些方面和维度来设计各项指标,给产品的设计和运营提供数据上的支持?请给出具体的维度和指标,并说明原因。
网易游戏的一道笔试题是给定一条包含3个join的SQL语句,要求写代码模拟实现SQL的功能。

编程题
最少时间复杂度求数组中第k大的数,写code
去除字符串S1中的字符使得最终的字符串S2不包含’ab’和’c’,写code
长度为N的序列Sequence=abc….Z,问有多少不同的二叉树形态中序遍历是这个,写递推公式
给定整数n和m,问能不能找出整数x,使得x以后的所有整数都可以由整数n和m组合而成
中序遍历二叉树,利用O(1)空间统计遍历的每个节点的层次,写bug free的code
排序二叉树转双向链表
一个运算序列只有+、*、数字,计算运算序列的结果
机器学习&数据挖掘问题
L1和L2正则项 >> 它们间的比较
各个模型的Loss function,牛顿学习法、SGD如何训练
介绍LR、RF、GBDT ,分析它们的优缺点,是否写过它们的分布式代码
介绍SVD、SVD++
是否了解线性加权、bagging、boosting、cascade等模型融合方式
推荐系统的冷启动问题如何解决
是否了解A/B Test以及A/B Test结果的置信度
特征工程经验
是否了解mutual infomation、chi-square、LR前后向、树模型等特征选择方式


 解决方案类题目
为今日头条设计一个热门评论系统,支持实时更新
给定淘宝上同类目同价格范围的两个商品A和B,如何利用淘宝已有的用户、商品数据、搜索数据、评论数据、用户行为数据等所有能拿到的数据进行建模,判断A和B统计平均性价比高低。统计平均性价比的衡量标准是大量曝光,购买者多则高。
有n个elements和1个Compare(A, B)函数,用Compare函数作为排序算法中的比较算子给elements排序。Compare函数有p的可能比较错。排序完取Top m个元素,本来就在Top m并被正确分在Top m的元素个数是x。问x的数学期望。




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值