自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 Task03_特征工程_0328

补充:用箱线图删除异常值: 1)为什么用箱型图?——受异常值影响小、对数据无限制要求 虽然这种标准有点任意性,但它来源于经验判断,经验表明它在处理需要特别注意的数据方面表现不错。这与识别异常值的经典方法有些不同。 众所周知,基于正态分布的3σ法则或z分数方法是以假定数据服从正态分布为前提的,但实际...

2020-03-28 21:53:16

阅读数 6

评论数 0

原创 Task02_数据的探索性分析_0324

EDA(Exploratory Data Analysis): 是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。 实际中一直都没有接触过5w+以上的数据,跟着TASK02的内容做了一遍...

2020-03-24 20:04:08

阅读数 436

评论数 0

提示
确定要删除当前文章?
取消 删除