自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 资源 (1)
  • 收藏
  • 关注

原创 hive错误锦集

我的hive错误锦集-1性能问题:一个条件的错误在去年写了一个hive脚本,今年需求有变,条件细分。于是脚本改动较大,也没有考虑太多就开始改动。完成后测试运行速度,发现运行时间为改动前的三倍,当时需求很急,草草跑出数据提交了。后来又需要该脚本来用,才想起来效率问题,于是开始研究速度慢下来的原因。第一次将37个步骤的运行时间分离出来,发现问题出在某一个步骤上。这就好办了,单独拿出

2017-03-15 11:43:54 511

原创 数据分析之数据预处理

数据预处理步骤及方法1、缺失值处理1.1、造成缺失值原因缺失值处理原则:使用最可能的值代替缺失值,使缺失值与其他数值之间的关系保持最大。缺失值处理的方法很多,比如删除记录、均值填充、中位数填充等,具体方法如表1所示。2、异常值处理异常值是数据集中偏离大部分数据的数据。从数据值上表现为:数据集中与平均值的偏差超过两倍标准差的数据,其中与

2017-03-06 18:01:53 19388 1

ssh仓库管理系统

ssh仓库管理系统

2016-07-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除