clementine多变量标准化操作方法


1、对于clementine中的节点功能,自己仅仅只用了"初级功能"。所谓初级功能,就是知道这个节点有什么作用?比如导出节点,可以导出一个新的字段。如果数据宽表中有3个月总的收入,那么可以导出3个月的均值=3个月总的费用/3。填充节点,可以填充宽表中的为空、为null值为0等等。这些数据处理方面的能力仅仅停留在很浅显的层面,往往在实际工作中遇到的问题,这些初级数据处理能力会导致无法解决问题,或者处理问题很繁杂。

   2、由于工作中数据处理的需要,需要对于很多字段进行数据标准化操作。刚开始很头疼,需要一个字段一个字段进行处理,浪费时间而且往往容易出错。然后自己开始抱怨clementine数据处理能力太差了。但随着对于clementine中的函数方面的功能的进一步了解,这才发现其实clementine的数据处理能力还是不错的。只是有些功能自己不会而已。

  3、对多个字段进行标准化操作,先选择模式为多个,然后选择你要标准化的字段,然后写入如下代码,就可以进行标准化操作了,@FIELD代表了各个字段的值 @GLOBAL_MEAN(@FIELD)代表各个字段的平均值,@GLOBAL_SDEV(@FIELD)代表各个字段的标准差,从而衍生出各个字段的标准差。标准化的字段名称为各字段名称后面加上_导出1。记得用设置全局量节点生成各个字段全局平均值和全局标准差,不然会报错。

  

clementine多变量标准化操作方法


                                   图1:各字段进行标准化

 

clementine多变量标准化操作方法

                                 图2:各字段衍生出全局平均值、标准差 



原文:http://blog.sina.com.cn/s/blog_6838e0b401012juy.html

***************************************************************************************************************

,set globals节点在output文件夹。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值