- 博客(2)
- 收藏
- 关注
原创 Task 3 特征工程
Task 3 特征工程1.异常处理2.特征归一化/标准化3.数据分桶4.缺失值处理5.特征构造 1.异常处理 (1)通过箱线图(或3-Sigma)分析删除异常值; (2)BOX-COX转换(处理有偏分布); (3)长尾截断、; 2.特征归一化/标准化 (1)标准化(转换为正态分布); (2)归一化; (3)针对幂律分布,可采用公式:????????????( 1+x/(1+median)) 3.数据分桶 (1)等频...
2020-03-28 20:15:59 134
原创 Task 2 数据分析(EDA)
Task 2 数据分析(EDA)1 载入数据(训练集,测试集)2 判断数据确实和异常3 了解预测值分布4 类别特征分布5 数字特征分析6 碎碎念 在此之前基本没有关于python以及数据挖掘的经验,所以前期不管是库的安装还是按照指导pdf敲代码,都经常遇到错误,小白只能边查边改边学,头秃的同时也强迫自己学到了不少东西。前半部分的代码还能勉强一边敲一边理解,后面只能走一下流程,粗略地了解一下EDA的...
2020-03-24 20:52:44 262
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人