实用比赛工具
文章平均质量分 92
记录一些在做比赛使用到的实用便捷的工具
Facouse
这个作者很懒,什么都没留下…
展开
-
记录自己第一个Kaggle银牌
从六月以来,一直在华为实习,没抽出时间写一写文章,最近很开心的是刚结束的Kaggle比赛U.S. Patent Phrase to Phrase Matching中取得了银牌,很感谢队友给予的大力帮助,在这里简述一下具体的做法,以作回顾。...原创 2022-07-05 22:32:54 · 1063 阅读 · 1 评论 -
通过这篇文章带您了解处理不均衡数据的思想与实践
处理不均衡数据主要思想数据方面算法方面实践主要思想在处理不平衡数据主要从两方面入手:数据集方面、算法本身方面数据方面对数据进行重采样,使原本不均衡的样本变得均衡。最简单的处理不均衡样本集的方法是随机采样。随机过采样:从少数类样本集中随机重复抽取样本(有放回)以得到更多样本随机欠采样:从多数类样本中随机选取较少的样本(有放回或无放回)以得到更多样本上述方法只是简单的重复的复制样本,采取一些方法生成新的样本对于过采样:SMOTE:对少数类样本集SminS_{min}Smin中的每个样本原创 2022-04-17 21:05:35 · 841 阅读 · 0 评论 -
Featuretools快速使用指南--看这一篇就够了
Featuretools简单攻略Featuretools介绍Featuretools快速开始Featuretools介绍人工特性工程是一项冗长乏味的任务,并且受到人类想象力的限制——我们可以思考创建的特性只有这么多,而且随着时间的推移,创建新特性需要大量的时间。理想情况下,应该有一个客观的方法来创建一系列不同的候选新特性,然后我们可以将这些特性用于机器学习任务。这个过程的目的不是替换数据科学家,而是使他的工作更容易,并允许他使用自动工作流补充领域知识。Featuretools快速开始以官方文档为例原创 2022-03-11 21:48:02 · 8308 阅读 · 0 评论 -
机器学习之特征工程理解与总结
机器学习 -- 特征工程什么是特征工程数据预处理无量纲化标准化区间缩放标准化与归一化的区别对定量特征二值化对定性特征哑编码缺失值计算数据变换回顾特征选择Filter方差选择法相关系数法卡方检验互信息法Wrapper递归特征消除法Embedded基于惩罚项的特征选择法基于树模型的特征选择法回顾降维主成分分析法(PCA)线性判别分析法(LDA)回顾什么是特征工程有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动转载 2022-03-09 09:40:37 · 297 阅读 · 0 评论