- 博客(1)
- 资源 (3)
- 收藏
- 关注
原创 Kaggle爬梯之路
一 数据质量分析 脏数据:不符合要求,不能进行分析的数据 缺失值 异常值 不一致的值 重复的数据 含有特殊符号的数据(&×%¥) 数据缺失值分析 删除 可能值进行插补 不处理 > 异常值分析的三种方法 简单的统计量的分析 数据应该有实际意义,手工去除不符合实际的数据 3σ原则 异常值:一组测定值中与平均值的偏差超过3倍标准差的...
2018-04-17 20:01:01 574
hdfs_jar.zip
Flume配置HDFS所需jar包
commons-configuration-1.6.jar
commons-io-2.6.jar
hadoop-auth-2.6.0-cdh5.16.2.jar
hadoop-common-2.6.0-cdh5.16.2.jar
hadoop-hdfs-2.6.0-cdh5.16.2.jar
htrace-core-3.2.0-incubating.jar
2020-08-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人