数据挖掘
weixin_43901423
这个作者很懒,什么都没留下…
展开
-
Datawhale--task3(特征工程)
3.1 特征工程目标对于特征进行进一步分析,并对于数据进行处理3.2 内容:常见的特征工程包括:异常处理:通过箱线图(或 3-Sigma)分析删除异常值;BOX-COX 转换(处理有偏分布);长尾截断;特征归一化/标准化:标准化(转换为标准正态分布);归一化(抓换到 [0,1] 区间);针对幂律分布,可以采用公式:1+x )log( 1+median数据分桶:等频分...原创 2020-03-27 23:17:10 · 96 阅读 · 0 评论 -
Datawhale---Task2(EDA-数据探索性分析)
1、目标2、相关概念(1)EDA(Exploratory Data Analysis)也叫探索性数据分析(2)EDA的价值: 熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。 了解数据集中变量间的相互关系以及变量与预测值之间的存在关系。 进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加靠。3...原创 2020-03-23 21:36:55 · 297 阅读 · 0 评论 -
Datawhale--TASK1
1.1 学习目标理解赛题数据和目标,清楚评分体系。完成相应报名,下载数据和结果提交打卡(可提交示例结果),熟悉比赛流程1.2 了解赛题赛题概况、数据概况、预测指标、分析赛题1.2.1 赛题概况比赛要求参赛选手根据给定的数据集,建立模型,二手汽车的交易价格。来自 Ebay Kleinanzeigen 报废的二手车,数量超过 370,000,包含 20 列变量信息,为了保证 比赛的公平性,...原创 2020-03-21 14:11:47 · 226 阅读 · 0 评论