【面经&八股】搜广推方向:常见面试题(一)
文章目录
1. 线下效果提升、线上效果不好。
原因是多样的,主要原因在于样本与评估指标、环境。
- 在样本上,线下样本为历史数据,而线上样本难免出现新数据,同理还有新特征等
- 如线上的时间特征,在线下是无法训练的。
- 在评估指标上表现为评估指标不对等,线下评估指标需要更贴近业务才能更好地表示真实推荐结果(或线上指标)。
- 例如AUC表示的是所有user对所有item的评估指标,(AUC得分,衡量的是,用户交互的物品的概率比未交互物品的概率大,则得分高)
- 而线上更多需要单个 user 对其所有 item 的评估作为推荐结果,这时可以采用 GAUC,即对每个user的AUC做量权求和作为评估指标。
- 另外,线下训练很难还原线上环境。可以理解为线下训练无法捕获到全部的线上特征。
2. XGBoost 和 GBDT是什么?有什么区别?
GBDT:关键点在于Gradient和Boosting和DT(决策树&#x