IDEA的Maxcomputer Studio开发

一、安装

  在IDEA中File > Settings > Plugins中Browse repositories搜索安装即可:MaxCompute Studio

二、开发UDF、UDAF、UDTF

  //开发SQL脚本等暂不赘述,推荐DataWorks

  1.创建module(project)

    file->new->project,类型选择Maxcomputer java

     

  项目建成后目录简要说明:

    1.src:源码

    2.example:示例,可参考

    3.warehouse:本地运行时存放示例数据等

  2.开发调试UDF/UDTF/UDAF

    maven的依赖等由插件完成,直接在src->main->java中新建,new->maxcomputer java,kind选择对应的UDF类型即可!

    

  3.调试UDF/UDTF/UDAF

    测试数据在warehouse中,其中schema存放元数据,data存放数据,例如:

    

    数据:

    

    注意:

warehouse目录下依次是项目名,tables,表名,表schema和sample data。
schema文件依次配置项目名,表名,以及列名和类型(冒号分隔),分区表还需配置分区列(非分区表参考wc_in1,分区表参考wc_in2)。
data文件采用标准csv格式存储表的sample数据:
特殊字符为逗号,双引号和换行(\n或\r\n)
列分隔符为逗号,行分隔符为\n或\r\n
如果列内容里包含特殊字符,需要在该列内容前后加上双引号,例如:3,No -> “3, No”
如果列内容包含双引号,则每个双引号转义成两个双引号,例如:a”b”c -> “a””b””c”
\N表示该列为null,如果该列内容(string 类型)就是\N,需要转换为 “””\N”””
文件字符编码为UTF-8

  运行设置:

    右击UDF类,单击运行,弹出run configuration对话框,设置输入表与字段等

    

 

  #注意:

    插件会有本身的很多测试代码,直接打包可能会报错,我们可以直接在terminal运行跳过测试的打包命令:

 

1. mvn clean 清理上次生成的

2. mvn package -Dmaven.test.skip=true

 

 

 

  #python版本敬请期待!

转载于:https://www.cnblogs.com/jiangbei/p/10100785.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值