ODPS算法任务开发流程

1.算法流程

 

2.ODPS计算框架

2.1 ODPS基础概念

建表规范:

 红色常用的,

 分区裁剪:

 误删回复

 2.2 ODPS SQL

 

 

 

 不建议动态分区

 UDF自定义函数:

在D2里开发使用。

 3. 数据仓库概念&研发平台

 数据的话主要使用:

DWD DWS层

 3.2研发平台:

 

 

4.ODPS性能优化!

4.1数据倾斜处理

 

 

 分区裁剪:

 

 

 优先使用系统函数,UDF自己定义的性能会差点:正则表达式少用

 

 点击detall:

5.  ODPS SQL优化详细版

5.1.优化注意细节【数据倾斜等】

 dumps在磁盘操作,数量越少越好。

  dumps:过多,增加内存2G,3G。

目标是dumps减到0.

 出现数据倾斜后再设置,对大量的数据进行再次分组。

 设计数据很小的,直接去掉对应join

 5.2 案例分析

logview

https://adc.alipay.com/articleDetail.htm?id=3959https://adc.alipay.com/articleDetail.htm?id=3959

 

 没有加分区过滤条件。

 

 

 

 

 

 

 

 http://help.aliyun-inc.com/internaldoc/detail/413456.htmlhttp://help.aliyun-inc.com/internaldoc/detail/413456.html

 

 

 先去重。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

汀、人工智能

谢谢支持

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值