Big大宝贝-CSDN博客

原创 she’ll

sed "s/[^']*'\([^']*\)'.*'\([^']*\)'.*/\1/" your_file.txt

2024-02-29 11:31:07 386

vim /root/.ssh/authorized_keysssh-rsa AAAAB3NzaC1yc2EAAAADAQABAAABAQClXM9QuQEsyapmqSd+R9l87RXkXrPmjHLk2fIyVWI9opduwEFOIqdZp3/zVmKcFowr+rZGIbFYHjKv1Ci2c50+on69ztR/nZc35gBxkd5AfsDPIlvU/d1Fm9gOWlrHKrD8xjOFL/42/7A7NbUd+uUS2fWMqZxBGB1NuBi0BueaAe6U+FHG+POL3c

2023-11-17 00:42:16 53 1

原创 Linux命令脚本

bin/bashthendodoneexitfidodone。

2023-10-13 12:36:49 45

原创 linux同步脚本

3. 遍历所有目录，挨个发送。#6. 获取当前文件的名称。#2. 遍历集群所有机器。#4. 判断文件是否存在。#1. 判断参数个数。

2023-10-13 12:35:30 43

原创 Hadoop-HDFS

1）Hadoop在设置副本数后在传入数据时会在接受到请求后通过NameNode检查目标文件是否存在，然后NameNode反馈是否可以上传，然后客户端请求发送第一个文件块上传到那几个DataNode服务器，NameNode会返回给它要上传的节点，在然后会挑选一个服务器上传数据，备份依靠链式传输，并逐级反馈接收情况。scp -r root@hadoop103:/user/root/hello.txt root@hadoop104:/user/root //是通过本地主机中转实现两个远程主机的文件复制；

2023-10-12 22:05:01 32

原创 Hudi的应用（4）

ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci COMMENT = '各分类商品交易统计' ROW_FORMAT = DYNAMIC;) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci COMMENT = '用户新增活跃统计' ROW_FORMAT = DYNAMIC;

2023-09-12 23:43:36 121 1

原创 Hudi的应用（3）

when '3102' then concat('满',cast(condition_amount as string),'件打',cast(10*(1-benefit_discount) as string),'折')when '3101' then concat('满',cast(condition_amount as string),'元减',cast(benefit_amount as string),'元')-- ods_sku_sale_attr_value 插入数据。

2023-09-12 23:41:43 125 1

原创 Hudi的应用（2）

（1）元数据：.hoodie目录对应着表的元数据信息，包括表的版本管理（Timeline）、归档目录（存放过时的instant也就是版本），一个instant记录了一次提交（commit）的行为、时间戳和状态，Hudi以时间轴的形式维护了在数据集上执行的所有操作的元数据；（4）如果是 update 消息，写对应的 file group + file slice，直接 append 最新的 log file（如果碰巧是当前最小的小文件，会 merge base file，生成新的 file slice）

2023-09-12 23:37:49 241 1

原创 Hudi的应用（1）

例如业务系统中与商品相关的表有sku_info，spu_info，base_trademark，base_category3，base_category2，base_category1等，其中sku_info就称为商品维度的主维表，其余表称为商品维度的相关维表。而当需要一个大型的存储，而当前没有明确的数据应用用户或者是目标，将来想要使用这些数据的人可以在使用时开始设计架构，此时，数据湖更适合。但数据湖的设计理念是相反的，数据仓库是为了保障数据的质量、数据的一致性、数据的重用性等对数据进行结构化处理。

2023-09-12 23:28:58 60 1

qq_43520412的博客

原创 she’ll

原创 ssh免密

原创 Linux命令脚本

原创 linux同步脚本

原创 Hadoop-HDFS

原创 Hudi的应用（4）

原创 Hudi的应用（3）

原创 Hudi的应用（2）

原创 Hudi的应用（1）

原创 Hudi的使用

原创 Datax

原创 Hbase

空空如也

空空如也