自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 Task 3 特征工程

Task 3 特征工程1.异常处理2.特征归一化/标准化3.数据分桶4.缺失值处理5.特征构造 1.异常处理 (1)通过箱线图(或3-Sigma)分析删除异常值; (2)BOX-COX转换(处理有偏分布); (3)长尾截断、; 2.特征归一化/标准化 (1)标准化(转换为正态分布); (2)归一化; (3)针对幂律分布,可采用公式:????????????( 1+x/(1+median)) 3.数据分桶 (1)等频...

2020-03-28 20:15:59 134

原创 Task 2 数据分析(EDA)

Task 2 数据分析(EDA)1 载入数据(训练集,测试集)2 判断数据确实和异常3 了解预测值分布4 类别特征分布5 数字特征分析6 碎碎念 在此之前基本没有关于python以及数据挖掘的经验,所以前期不管是库的安装还是按照指导pdf敲代码,都经常遇到错误,小白只能边查边改边学,头秃的同时也强迫自己学到了不少东西。前半部分的代码还能勉强一边敲一边理解,后面只能走一下流程,粗略地了解一下EDA的...

2020-03-24 20:52:44 262

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除