阿里云ACA 使用时间序列分解模型预测商品销量（二）

最新推荐文章于 2024-06-01 10:44:14 发布

白鸽…

最新推荐文章于 2024-06-01 10:44:14 发布

阅读量733

点赞数 1

分类专栏：笔记文章标签：阿里云大数据 ACA 学习笔记

本文链接：https://blog.csdn.net/weixin_45903673/article/details/107240135

版权

本文接上一篇使用时间序列分解模型预测商品销量———数据预处理

发表本博客的目的在于记录笔记，分享经验，无其他任何目的

2.1 数据预处理

这一步将会使用PAI中的四个组件：
“源/目标”–“读数据表”：从MaxCompute读取数据表至PAI；
“工具”–“SQL脚本”：可通过SQL脚本编辑器编写SQL语句；
“数据预处理”–“拆分”：可以对数据按比例或按阀值进行拆分；
“数据预处理”–“缺失值填充”：可以对数据的缺失值进行均值、中位数或按特定规则进行填充。

该实验需要使用的数据：
链接：https://pan.baidu.com/s/1LoDAfH3snlyIxYB6ueaTnA
提取码：37h8

下面我们创建数据源表，在DataWorks开发环境,新建一个ODPS SQL 操作节点
在这里插入图片描述
输入名字（自定义），点击“提交”按钮：

在这里插入图片描述
输入建表语句，点击运行：

建表语句：

CREATE TABLE transaction_details
(
TRANSACTION_ID string,
TRANS_DT datetime,
STORE_ID string,
CUSTOMER_ID string,
PRODUCT_ID string,
DEP string,
SUBDEP string,
CAT string,
SUBCAT string,
QUANTITY int,
UNIT_COST double,
UNIT_PRICE double,
FEATURE string
);