推荐系统
Luna2137
这个作者很懒,什么都没留下…
展开
-
NDCG的理解
概念NDCG,Normalized Discounted cumulative gain 直接翻译为归一化折损累计增益,可能有些晦涩,没关系下面重点来解释一下这个评价指标。这个指标通常是用来衡量和评价搜索结果算法(注意这里维基百科中提到了还有推荐算法,但是我个人觉得不太适合推荐算法,后面我会给我出我的解释)。DCG的两个思想:1、高关联度的结果比一般关联度的结果更影响最终的指标得分;2、有高关联度的结果出现在更靠前的位置的时候,指标会越高;累计增益(CG)CG,cumulative gain,是D转载 2020-10-29 16:55:37 · 7709 阅读 · 0 评论 -
天池大赛——二手车交易价格预测方案分享(一)
这个比赛是天池的一个数据挖掘入门赛,要求根据提供的数据预测二手车的交易价格,属于回归问题,此篇主要分享一下特征工程和基础模型方面的思路。 **1. 特征基本统计**date_cols = ['regDate', 'creatDate']cate_cols = ['name', 'model', 'brand', 'bodyType', 'fuelType', 'gearbox', '...原创 2020-04-17 15:13:31 · 3437 阅读 · 0 评论 -
天池大赛——二手车交易价格预测方案分享——神经网络
这个比赛是天池上的一个入门比赛,要求根据提供的数据预测二手车的交易价格,是一个回归问题。特征工程主要参考的baseline的方法,最终得到是180维的特征,这里主要分享一下模型方面的设计思路。 推荐系统最常用的模型是LightGBM...原创 2020-04-14 15:08:43 · 3030 阅读 · 2 评论 -
[转载]与XGBoost、LightGBM并肩,一文理解CatBoost
本文转载自公众号:Microstrong和DatawhaleCatBoost和XGBoost、LightGBM并称为GBDT的三大主流神器,都是在GBDT算法框架下的一种改进实现。1. CatBoost简介CatBoost是俄罗斯的搜索巨头Yandex在2017年开源的机器学习库,是Boosting族算法的一种。CatBoost和XGBoost、LightGBM并称为GBDT的三大主流神器...原创 2020-04-03 13:00:09 · 392 阅读 · 0 评论