背景:多维数据仓库中的维度表和事实表一般都需要有一个代理键,作为这些表的主键,代理键一般由单列的自增数字序列构成。MaxCompute(原ODPS)没有关系数据库中的自增列 auto-increment id,但可以通过UDF来给海量数据的每一行产生唯一的id。
效果如下:
select row_sequence(),name from user_info;

一、准备工作
1、准备阿里云账号,文档参考:
本文档介绍了如何在MaxCompute中利用UDF(用户自定义函数)模拟自增列,以生成多维数据仓库中的代理键。教程涵盖了从准备工作,如开通服务和配置开发环境,到创建和注册UDF,最后通过大数据开发套件验证列自增长效果。需要注意的是,对于海量数据并行处理,可能存在重复,推荐使用uuid()函数。
背景:多维数据仓库中的维度表和事实表一般都需要有一个代理键,作为这些表的主键,代理键一般由单列的自增数字序列构成。MaxCompute(原ODPS)没有关系数据库中的自增列 auto-increment id,但可以通过UDF来给海量数据的每一行产生唯一的id。
效果如下:
select row_sequence(),name from user_info;

一、准备工作
1、准备阿里云账号,文档参考:

被折叠的 条评论
为什么被折叠?