机器学习算法竞赛
文章平均质量分 96
《机器学习算法竞赛实战》
飞行模式yu
SEU
展开
-
【快速入门推荐算法/基于top-k的推荐赛】——随堂笔记汇总
比赛名称:RecSys Challenge 2022赛题链接:RecSys Challenge 2022推荐指数:4颗星这个比赛是非常典型的top-k推荐的比赛,也是最能模拟一个实际推荐全流程的比赛,相似的比赛还有很多,就比如2020年的KDD的Debias比赛,还有最近在Kaggle上举行的H&M时尚推荐等等,通过对这类top-k推荐问题的学习,可以很好的理解推荐系统的全流程中的各阶段的算法,可以让大家对推荐系统有一个整体的认识。1.赛题介绍我们将通过算法使零售商能够更准确地预原创 2022-05-28 20:39:02 · 1476 阅读 · 1 评论 -
《机器学习算法竞赛实战》整理 | 八、实战案例:Elo Merchant Category Recommendation
前言比赛链接:https://www.kaggle.com/competitions/elo-merchant-category-recommendation/overview8.1 赛题理解8.1.1 赛题背景想象一下,当你在一个不熟悉的地方饿着肚子想要找好吃的东西时,你是不是会得到基于你的个人喜好而被专属推荐的餐馆,且该推荐还附带着你的信用卡提供商为你提供的附近餐馆的折扣信息。目前,巴西最大的支付品牌之一Elo已经与商家建立了合作关系,...原创 2022-05-09 18:09:01 · 1953 阅读 · 0 评论 -
《机器学习算法竞赛实战》整理 | 七、用户画像
前言用户:产品的使用者数据收集方为了退关产品同时持续维护和改善用户体验需要对由用户操作而产生的数据进行挖掘,以期从中发现群体乃至个体的行为偏好,形成数据层面上的所谓画像。主要内容:用户画像、标签系统、用户画像数据特征、用户画像应用、思考练习。7.1 用户画像用于商业分析和数据挖掘的用户画像。7.2 标签系统核心就是给用户打标签,用来分析社会属性、社会习惯、生活习惯、消费行为。7.2.1 标签分类方式举例7.2.2 多渠道获取标签(1)事实类直接来自原始数据原创 2022-05-08 14:36:34 · 2222 阅读 · 0 评论 -
《机器学习算法竞赛实战》整理 | 六、模型融合
前言本章将向大家介绍在算法竞赛中提分的关键步骤,这也是最后阶段的惯用方法,即模型融合(或者集成学习),通过结合不同子模型的长处进行模型融合,当然这是在理想状态下。本章主要分为构建多样性、训练过程融合和训练结果融合三部分。模型融合常常是竞赛取得胜利的关键,相比之下具有差异性的模型融合往往能给结果带来很大提升。了解的模型融合方法越多,最后取胜的概率就会越高。本章从这三个部分介绍不同模型融合方法的应用场景,同时给出使用技巧和应用代码。6.1 构建多样性介绍三种模型融合中构建多样性的方式..原创 2022-05-05 15:43:22 · 2860 阅读 · 0 评论 -
《机器学习算法竞赛实战》整理 | 五、模型训练
目录5.1 线性模型5.1.1Lasso回归5.1.2 Ridge回归5.2 树模型5.3 神经网络5.4 实战案例5.1 线性模型5.1.1Lasso回归Lasso回归,是对普通的线性回归采用L1正则化进行优化,通过乘法或限制估计值的绝对值之和,可以使某些系数为零,从而达到特征稀疏化和特征选择的效果。当我们需要一些自动的特征、变量选择,或者处理高度相关的预测因素时,很方便。代码实现:from sklearn.linear_model impor..原创 2022-05-02 20:44:33 · 2579 阅读 · 0 评论 -
《机器学习算法竞赛实战》整理 | 四、特征工程
目录4.4 特征选择4.4.1 特征关联性分析(1)皮尔逊相关系数(2)卡方检验(3)互信息法4.4.2 特征重要性分析(1)weight计算方式(2)gain计算方式(3)cover计算方式4.4.3 封装方法(1)启发式方法(2)递归消除特征法4.5 实战案例4.5.1 数据预处理4.5.2 特征提取(1)基本特征构造4.4 特征选择特征选择算法用于从数据中识别并删除不需要、不相关以及冗余的特征,这些特征可能会降低模型的准确原创 2022-05-02 11:50:47 · 2612 阅读 · 1 评论