推荐
ElsaRememberAllBug
这个作者很懒,什么都没留下…
展开
-
推荐算法(一) GBDT+LR
推荐算法(一) GBDT+LR原创 2019-03-20 15:36:10 · 795 阅读 · 0 评论 -
推荐算法 (二) 微软开源项目
推荐算法 (二) 微软开源项目原创 2019-03-20 15:38:49 · 647 阅读 · 0 评论 -
推荐算法(三)基于标签的算法--CTR预估
1、在工业界,数据量非常大,如果用pandas读入,虽然方便后续数据操作,但占用内存过多。工业界一般存储稀疏数据用LIBSVM。2、在进行建模前,先进行探索,删除脏数据,分析下各个特征的初步效果;对不均衡的样本,下采样,然后有多个分类器,通过bagging合并。3、在排序ranking场景下,评估指标经常是AUC4 时间预处理:映射为不同的时间段5、如果某一列的类别太多,(1)先做...原创 2019-03-20 15:39:26 · 544 阅读 · 0 评论