20131122新浪微博推荐工程师面试

1、什么情况下用指数函数拟合数据?(背景是想用指数函数拟合CTR与展示次数的关系,不知道这样子合适不?)


2、选择userCF与itemCF需要考虑的因素?

答:1、数据稀疏性。使用userCF要求用户相似度矩阵较稠密,使用itemCF要求物品相似度矩阵较稠密。

2、(用户与)物品更新频率。若物品更新特别快,则itemCF维护物品相似度矩阵成本较大。

3、对个性化和实时性的要求。userCF反映的是某一兴趣相同群体的热点,实时性较好,个性化不足。itemCF根据用户历史行为进行推荐,比较个性化。

4、解释性。itemCF可以解释,userCF难以解释。


3、logistic回归的目标函数是什么。(先询问了知道哪些ML算法,然后面试官挑了LR来问)

答:写的是tagert与hypothesis的最小二乘形式。还被面试官确认了一下“最小二乘”,随后被问似然函数是什么?现在想来,应该回答最小二乘形式等价于最大似然,在样本独立同分布的情况下。将logistic回归放在GLM框架中讲时,应该将框架的三条要求写完整,用该框架介绍logistic回归,然后介绍多元logistic回归。


4、询问的问题:微博中间的“好友关注”推荐与右侧的“可能感兴趣的人”推荐有什么区别?

答:中间是属于用户的空间,所做推荐更偏重于社交关系,很有可能是已经认识的,或者同一学校、同一工程的。右边的是商业空间,所做推荐可能更偏重兴趣。


5、了解哪些优化算法?

答:梯度下降、牛顿。对regulation了解不?知道,但讲不清楚。


6、推荐系统做什么事情?

答:将用户感兴趣的、但目前不知道的物品推荐给他。后续的问题是:怎么衡量用户不知道?怎么衡量用户感兴趣? 这个问题当时回答的不好。前者可以用物品的点击次数衡量,如果被所有人点击的次数的综合较少,则用户很有有可能不知道。后者:和某用户有相似行为的其他人感兴趣,则该用户也可能感兴趣。


今天面试时的不足:

1、没有将对LDA的了解提出来。

2、第二次被问到优化算法,要准备一下。





  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值