- 博客(2)
- 收藏
- 关注
原创 LR和GBDT高维稀疏特征
LR和GBDT高维稀疏特征面试被问到GBDT是否适合处理高维稀疏特征,没有答上来,感觉自己对模型理解深度不够。结论:LR适合处理高维稀疏特征,而GBDT不适合。主要原因有:1、高维特征会导致gbdt运行过于耗时2、从高维稀疏特征中难以进行有效的特征空间划分,且对噪音会很敏感。想想一个例子,有个年龄特征0~100,如果对这样特征进行one-hot编码后变为稀疏特征,第i维表示是否为i岁。...
2019-09-23 22:31:19 6346
原创 DeepFM
DeepFMCTR预估是推荐系统中根据用户特征对item进行点击率预测的一个任务。而CTR任务中面临的特征往往具有相关性,且经过one-hot编码后具有稀疏性。FM就是为处理这种稀疏的相关性而提出的。为了处理相关性,FM在一阶特征的基础上引入二阶特征项;而由于特征稀疏(尤其是二阶项组合,如所有xi*xj中0所占比例应比所有xi中0所占比例更高)导致二阶项组合大部分为0,这时二阶项系数矩阵必定存...
2019-09-18 23:38:45 282
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人