自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

ifeng

爬 梯 之 路

  • 博客(1)
  • 资源 (3)
  • 收藏
  • 关注

原创 Kaggle爬梯之路

一 数据质量分析 脏数据:不符合要求,不能进行分析的数据 缺失值 异常值 不一致的值 重复的数据 含有特殊符号的数据(&×%¥) 数据缺失值分析 删除 可能值进行插补 不处理 > 异常值分析的三种方法 简单的统计量的分析 数据应该有实际意义,手工去除不符合实际的数据 3σ原则 异常值:一组测定值中与平均值的偏差超过3倍标准差的...

2018-04-17 20:01:01 574

hdfs_jar.zip

Flume配置HDFS所需jar包 commons-configuration-1.6.jar commons-io-2.6.jar hadoop-auth-2.6.0-cdh5.16.2.jar hadoop-common-2.6.0-cdh5.16.2.jar hadoop-hdfs-2.6.0-cdh5.16.2.jar htrace-core-3.2.0-incubating.jar

2020-08-17

Linux操作系统原理知识点思维导图

Linux操作系统原理知识点思维导图,自己耗费2天时间一点一点做出来的,压缩包内有各种格式(km mm svg xmind png )

2019-01-08

ANACONDAN win 64(百度云)

内是百度云资源链接的一个txt文件,内是百度云资源链接的一个txt文件内是百度云资源链接的一个txt文件

2017-11-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除