大数据
文章平均质量分 65
Machine4869
这个作者很懒,什么都没留下…
展开
-
seatunnel(海量数据处理工具)实现HDFS导入Clickhouse
文章目录介绍快速开始案例1:HDFS导入Clickhouse ref: https://interestinglab.github.io/seatunnel-docs/#/zh-cn/v1/ 介绍 seatunnel 是一个非常易用,高性能、支持实时流式和离线批处理的海量数据处理产品,架构于Apache Spark 和 Apache Flink之上。 为什么需要seatunnel ? 让Spark的使用更简单,更高效。简化开发 特性 简单易用,灵活配置,无需开发 模块化和插件化,易于扩展 支持利用原创 2022-01-12 16:27:37 · 3840 阅读 · 0 评论 -
ClickHouse数据字典(很详细)
数据字典 参考:《ClickHouse原理解析与应用实践》第5章、第8章8.4.2节 数据字典是clickhouse提供的一种简单 实用的存储媒介,以键值和属性映射的形式定义数据。字典中的数据会主动或被动加载到内存之中,并支持动态更新。由于字典数据常驻内存特特性,比较适合保存常量或者经常使用的维度表数据,以避免不必要的JOIN数据。 数据字典分为内置和扩展两种形式,内置数据字典是以clickhouse默认自带的字典;外部字典是通过用户自定义配置实现的字典。 在正常情况下,字典中的数据只能通过字典函数访问原创 2021-11-17 16:24:58 · 4931 阅读 · 2 评论 -
Linux系列之Shell脚本
文章目录helloword入门多命令处理shell变量if 判断case 语句for 循环while 循环read 读取控制台输入函数shell工具 概述:shell常用代码总结 helloword入门 #!/bin/bash # 指定解析器 echo "helloworld" echo $A 多命令处理 #!/bin/bash # 多个命令 cd /home/machine/file touch "f01d02.txt" echo "hello BD" >> f01d02.txt原创 2021-07-21 10:52:48 · 153 阅读 · 0 评论