数据竞赛
致远记录
这个作者很懒,什么都没留下…
展开
-
datawhale数据竞赛day02-数据清洗
datawhale数据竞赛day02-数据清洗 数据清洗主要是删除原始数据集中的无关数据、重复戴护具,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值、异常值等 缺失值分析及处理 一、缺失值出现的原因分析 数据集会因为各种原因有所缺失,例如调查时没有记录某些观察值等。了解缺失的数据是什么至关重要,这样才可以决定下一步如何处理这些缺失值。 根据第一天ETA,UV和PV都有18条记录缺失 PV...原创 2020-01-10 21:02:17 · 212 阅读 · 0 评论 -
datawhale数据竞赛day01-认识数据
datawhale数据竞赛day01-认识数据 2019未来杯高校AI挑战赛 > 城市-房产租金预测” 认识数据 了解比赛的背景 分类问题还是回归问题 熟悉比赛的评分函数 对比赛数据做EDA 缺失值分析 特征值分析 是否有单调特征列(单调的特征列很大可能是时间) 特征nunique分布 统计特征值出现频次大于100的特征 Label分布 不同的特征值的样本的label的分布 认识数据...原创 2020-01-07 20:56:21 · 203 阅读 · 1 评论