1.拉链表介绍
拉链表不存储冗余的数据,只有某行的数据发生变化,才需要保存下来,相比每次全量同步会节省存储空间 能够查询到历史快照。
2.拉链表构建
-- 1、MySQL创建商品表
-- 创建数据库
drop database if exists demo;
CREATE DATABASE demo CHARACTER SET utf8 COLLATE utf8_general_ci; -- 创建商品表
create table if not exists demo.product(
goods_id varchar(50), -- 商品编号
goods_status varchar(50), -- 商品状态
createtime varchar(50), -- 商品创建时间
modifytime varchar(50) -- 商品修改时间
) ;
--2、Hive-ODS层建表
-- 创建表
drop database if exists demo cascade;
create database if not exists demo;
-- 创建ods层表
create table if not exists demo.ods_product(
goods_id string, -- 商品编号
goods_status string, -- 商品状态
createtime string, -- 商品创建时间
modifytime string -- 商品修改时间
)
partitioned by (dt string) --按照天分区
row format delimited fields terminated by '\t';
--3、Hive dw层创建拉链表
-- 创建拉链表
create table if not exists demo.dwd_product(
goods_id string, -- 商品编号
goods_status string,