拉链表(小记)

创建外部表

create database lalian;
use lalian;

create external table orders(
    orderId int,
    createDate string,
    modifiedTime string,
    status string
)
row format delimited fields terminated by '\t'
location '/tmp/lalian/orders';

将编写的orders.txt上传到hdfs

[root@cp145 ~]# vim ./orders.txt

1 2023-03-03 2023-03-03 创建
1 2023-03-03 2023-03-03 创建
1 2023-03-03 2023-03-03 创建

[root@cp145 ~]# hdfs dfs -mkdir -p /tmp/lalian/orders/
[root@cp145 ~]# hdfs dfs -put ./orders.txt /tmp/lalian/orders/

用select可以查到数据
在这里插入图片描述

创建一个增减分区表

create table ods_orders_inc(
    orderId int,
    createDate string,
    modifiedTime string,
    status string
) partitioned by (day string) --通过day分区
row format delimited fields terminated by '\t';

将orders表的数据传入ods_orders_inc

insert overwrite table ods_orders_inc partition (day = '2023-03-03')
select orderId,createDate,modifiedTime,status from orders;
select * from ods_orders_inc;

在这里插入图片描述

查看分区

show partitions ods_orders_inc;

在这里插入图片描述

创建历史表

create table dws_orders_his(
    orderId int,
    createDate string,
    modifiedTime string,
    status string,
    start_time string,
    end_time string
) row format delimited fields terminated by '\t';

插入数据

insert overwrite table dws_orders_his
select orderId,
	   createDate,
	   modifiedTime, 
	   status, 
	   modifiedTime,-- start_time 
	   '9999-12-31' -- end_time 
from ods_orders_inc where day = '2023-03-03';

查看数据

select * from dws_orders_his;

在这里插入图片描述

操作

将hdfs中的orders.txt删除,上传增加了字段的新orders.txt
在这里插入图片描述
覆写分区表

insert overwrite table ods_orders_inc partition (day='2023-03-04')
select orderId, createDate, modifiedTime, status from orders
where modifiedTime = '2023-03-04';

查看分区,出现03-04分区

show partitions ods_orders_inc;

在这里插入图片描述
查看 day=‘2023-03-04’ 分区

select * from ods_orders_inc where day='2023-03-04';

将03-04分区的数据整合覆盖到历史表中

with
t1 as (select orderId, createDate, modifiedTime, status, modifiedTime start_time,'9999-12-31' end_time
    from ods_orders_inc where day = '2023-03-04'),
t2 as ( select
    t1.orderId,t1.createDate,t1.modifiedTime,t1.status,t1.start_time,
       if(t2.orderId is not null and t1.end_time > '2023-03-04','2023-03-04',t1.end_time) end_time
    from dws_orders_his t1 left join (select orderId,modifiedTime from ods_orders_inc where day = '2023-03-04') t2
    on t1.orderId = t2.orderId ),
t3 as (select * from t1 union all select * from t2)
insert overwrite table dws_orders_his
select * from t3 order by t3.orderId,t3.modifiedTime;
--或者
insert overwrite table dws_orders_his
select tb.orderId,tb.createDate,tb.modifiedTime,tb.status,tb.start_time,tb.end_time
from (
(select orderId, createDate, modifiedTime, status,modifiedTime as start_time,'9999-12-31' as end_time
from ods_orders_inc where day='2023-03-04')
union all
(select t1.orderId,
       t1.createDate,
       t1.modifiedTime,
       t1.status,
       t1.start_time,
       case when t2.orderId is not null and t1.end_time > '2023-03-04'
            then '2023-03-04' else t1.end_time end end_time
from dws_orders_his t1 left join (select orderId from ods_orders_inc where day='2023-03-04') t2
on t1.orderId = t2.orderId)
) tb order by tb.orderId,tb.start_time;
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Protobuf是一种高效的序列化协议,可以用于数据交换和数据存储。它的主要优势是大小小,速度快,可扩展性强。下面是使用Protobuf的一些小记: 1. 定义消息格式 首先,需要定义消息格式,以便Protobuf可以将数据序列化和反序列化。消息格式定义在.proto文件中,使用protobuf语言编写。例如,下面是一个简单的消息格式定义: ``` syntax = "proto3"; message Person { string name = 1; int32 age = 2; } ``` 这个消息格式定义了一个名为Person的消息,包含两个字段:name和age。 2. 生成代码 一旦消息格式定义好,就可以使用Protobuf编译器生成代码。编译器将根据消息格式定义生成相应的代码,包括消息类、序列化和反序列化方法等。可以使用以下命令生成代码: ``` protoc --java_out=. message.proto ``` 这将生成一个名为message.pb.java的Java类,该类包含Person消息的定义以及相关方法。 3. 序列化和反序列化 一旦生成了代码,就可以使用Protobuf序列化和反序列化数据。例如,下面是一个示例代码,将一个Person对象序列化为字节数组,并将其反序列化为另一个Person对象: ``` Person person = Person.newBuilder() .setName("Alice") .setAge(25) .build(); byte[] bytes = person.toByteArray(); Person deserializedPerson = Person.parseFrom(bytes); ``` 这个示例代码创建了一个Person对象,将其序列化为字节数组,然后将其反序列化为另一个Person对象。在这个过程中,Protobuf使用生成的代码执行序列化和反序列化操作。 以上是使用Protobuf的一些基本步骤和注意事项,希望对你有所帮助!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值