简介
目标是让云上数据仓库用户及开发者通过简单的步骤体验基于AnalyticDB MySQL版和DMS构建云原生数据仓库的主要流程,场景将通过实例的开通、结构与数据的初始化、报表的开发、报表可视化等环节,用3个具体的应用场景来体验AnalyticDB MySQL版在新零售场景下的交互查询和ETL计算速度,以及通过DMS进行数据仓库数据报表开发的流程。
提供的数据集是一个零售场景的模拟数据,包括客户信息、订单记录、货物信息、国家地域信息等内容,数据总量10GB,最大数据表记录数为5999万条。
产品简介
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:2003 语法标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。
数据管理DMS是基于阿里巴巴集团十余年的数据库服务平台的云版本,提供免安装、免运维、即开即用、多种数据库类型与多种环境统一的web数据库管理终端;可以为企业用户快速复制搭建与阿里集团同等安全、高效、规范的数据库DevOps研发流程、数仓开发解决方案。
创建高权限账号
ADB集群详情页,按需自定义高权限的账号与密码
每个集群仅限1个高权限账号,可修改密码;
后续可通过DMS新建普通账号(ADB实例在DMS上直接以免费的自由操作管控模式使用即可)
地址:https://ads.console.aliyun.com/adb/cn-shenzhen/instances
选择已创建ADB实例所在的地域,并点击实例名称。
创建数据库
数据库库名可按需自定义。
地址:https://ads.console.aliyun.com/adb/cn-shenzhen/instances
选择已创建ADB实例所在的地域,并点击实例名称。
创建OSS外表
说明:
下列建表语句需要根据ADB的地域分别替换endpoint和URL参数中的字符串。例如ADB在北京区域。
需要将endpoint ”oss-cn-shenzhen-internal.aliyuncs.com“ 替换成”oss-cn-beijing-internal.aliyuncs.com“,
需要将URL中的”oss://adb-tpch-shenzhen“ 替换成”oss://adb-tpch-beijing“
各个地域替换的代码:
深圳:shenzhen
北京:beijing
杭州:hangzhou
上海:shanghai
张家口:zhangjiakou
注意:下列建表语句需要根据您云账号的accessid、accesskey 替换后方执行。
地址:https://dms.aliyun.com/
路径:全部功能-数据方案-数据导入
初始化表结构语句如下:(注,脚本需要本地编辑替换相关信息后,保存为一个.sql后缀的文本用于工单的提交)
####1、CUSTOMER 外表
CREATE TABLE `OSS_CUSTOMER` (
`C_CUSTKEY` int NOT NULL,
`C_NAME` varchar NOT NULL,
`C_ADDRESS` varchar NOT NULL,
`C_NATIONKEY` int NOT NULL,
`C_PHONE` varchar NOT NULL,
`C_ACCTBAL` decimal(12, 2) NOT NULL,
`C_MKTSEGMENT` varchar NOT NULL,
`C_COMMENT` varchar NOT NULL
,`dummy` varchar
) engine='oss'
TABLE_PROPERTIES='{
"endpoint":"oss-cn-shenzhen-internal.aliyuncs.com",
"accessid":"xxxxxxxx",
"accesskey":"xxxxxxxx",
"delimiter":"|",
"URL":"oss://adb-tpch-shenzhen/tpch/10g/customer/customer.tbl"
}';
####2、ORDERS外表
CREATE TABLE `OSS_ORDERS` (
`O_ORDERKEY` bigint NOT NULL,
`O_CUSTKEY` int NOT NULL,
`O_ORDERSTATUS` varchar NOT NULL,
`