自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 LR和GBDT高维稀疏特征

LR和GBDT高维稀疏特征面试被问到GBDT是否适合处理高维稀疏特征,没有答上来,感觉自己对模型理解深度不够。结论:LR适合处理高维稀疏特征,而GBDT不适合。主要原因有:1、高维特征会导致gbdt运行过于耗时2、从高维稀疏特征中难以进行有效的特征空间划分,且对噪音会很敏感。想想一个例子,有个年龄特征0~100,如果对这样特征进行one-hot编码后变为稀疏特征,第i维表示是否为i岁。...

2019-09-23 22:31:19 6324

原创 DeepFM

DeepFMCTR预估是推荐系统中根据用户特征对item进行点击率预测的一个任务。而CTR任务中面临的特征往往具有相关性,且经过one-hot编码后具有稀疏性。FM就是为处理这种稀疏的相关性而提出的。为了处理相关性,FM在一阶特征的基础上引入二阶特征项;而由于特征稀疏(尤其是二阶项组合,如所有xi*xj中0所占比例应比所有xi中0所占比例更高)导致二阶项组合大部分为0,这时二阶项系数矩阵必定存...

2019-09-18 23:38:45 277

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除