Kaggle
文章平均质量分 94
Snoopy_Yuan
想飞到那最高最远最辽阔
展开
-
Kaggle滑水 - 泰坦尼克之灾(决策树)
本文以Kaggle新手习题——Titanic: Machine Learning from Disaster为场景开展实验,以此熟悉Kaggle平台。本文的源码托管于我的Github:Practice-of-Machine-Learning/code/Kaggle_Titanic/,欢迎查看交流。1.任务概述Titanic: Machine Learning from Disa...原创 2018-04-26 11:52:56 · 1530 阅读 · 0 评论 -
Kaggle滑水 - CTR预估(LR)
下面,我们结合Kaggle赛题:Avazu:Click-Through Rate Prediction,练习数据挖掘技术在CTR预估中的应用。本文内容包括赛题任务简析,以及基于LR(逻辑斯蒂回归)的初步实现。本文的源码托管于我的Github:PnYuan - Kaggle_CTR,欢迎查看交流。1.任务概述CTR(Click Through Rate,点击率),是“推荐系统...原创 2018-06-15 11:28:47 · 1970 阅读 · 3 评论 -
Kaggle滑水 - CTR预估(GBDT-LR)
本文继续以Avazu-CTR赛题为场景,采用GBDT(梯度提升树)与LR(逻辑回归)相结合的方法来完成CTR预估任务;本文的源码托管于我的Github:PnYuan - Kaggle_CTR,欢迎查看交流。1.GBDT-LR方案集成模型如GBDT、XGBoost等,可被用于原始特征的转换与组合,从而自动构建出新的特征用于改进数据挖掘任务。这里,我们采用业界常用的GBDT-LR方...原创 2018-06-15 11:30:18 · 4069 阅读 · 1 评论 -
Kaggle滑水 - CTR预估(FM_FFM)
本文继续以Avazu-CTR赛题为背景,尝试采用FM(Factorization Machine,因子分解机)及FFM(Field-aware Factorization Machine,场感知因子分解机)来进行CTR预估任务。本文的源码托管于我的Github:PnYuan - Kaggle_CTR,欢迎查看交流。1.概念商用推荐场景中的CTR预估工作易面临大规模稀疏数据的挑战...原创 2018-06-15 11:31:17 · 2524 阅读 · 1 评论