叶星痕-CSDN博客

原创离线数仓搭建

1.先执行到这两个线条上面，然后上传date_info.txt到/warehouse/gmall/tmp/tmp_dim_date_info。注意：对自己机器有信心的话，直接执行脚本，没信心的话，执行一个，重启或者等待几分钟执行下一个。这三个不用管，所以开始前我们需要确定有这些文件和配置。上传base.txt到任意目录下，且cd到该目录。到后面将时间修改为06,07分别运行lg.sh。等吧，每个半个小时起步或者一个小时，是搞不定的。多出来13张表，也就是说，现在有30张表。执行两次就到我们需要的位置。

2024-06-16 15:43:59 999

原创使用Flink进行股票计算

在每个分区上，我们定义一个滑动窗口，窗口大小为60秒，然后使用AggregateFunction进行聚合计算。通过这个流程，我们可以实时计算每个股票代码在每分钟内的平均交易价格，为股票交易提供有价值的信息。这个程序的主要目的是读取股票数据，按照股票代码进行分组，然后在每个 60 秒的窗口内计算每种股票的平均价格，并打印到控制台。在这个类中，实现了 apply 方法，这是窗口函数的核心方法，它会在每个窗口结束时被调用。是一个辅助方法，用于将形式为 “HHmmss” 的时间字符串解析为一天中的秒数。

2024-06-16 15:39:45 1018

原创 Flink端到端的精确一次

这行代码启用了检查点，并设置了检查点的模式为精准一次。检查点间隔为5000毫秒。这行代码创建了一个Flink执行环境，它是所有Flink程序的开始。这行代码设置了检查点的存储路径，这里我们选择了HDFS作为存储介质。1.hadoop,zookeeper和kafka启动。只需要在实验一的基础上修改kafkf消费主题命令就行。3.创建对应需要的kafka主题。2.创建flink需要的存档点。更具代码的路径创建对应的目录。同KafkaEOSDemo。

2024-06-16 15:37:42 665

原创阿里云安装Hadoop全家桶

使用阿里云服务器安装 hadoop Hive Flume kafka zookeeper mysql等内容，教程从头开始且详细详细

2024-03-23 15:39:47 927 1

原创 Hadoop3.3.6安装和配置hbase-2.5.5-hadoop3x，zookeeper-3.8.3

/修改 zoo.cfg 配置文件，将 dataDir=/data/zookeeper/data 修改为指定的data目录。重点：以下配置都是在root用户下进行配置后续会给对应的hadoop用户权限。推荐一口气配置完在进行给予权限和进行配置文件的刷新，以及最后的分发。在安装过程中推荐设置root用户密码为1234方面后续操作。权限给 hadoop 用户配置相关权限。hadoop2,3分别创建软连接。hadoop2,3创建软连接。hadoop2 修改为2。hadoop3 修改为3。以hadoop3为例。

2023-11-21 21:46:03 2583 3

原创 Scrapy框架学习

对Scrapy框架学习以及自己的经验和踩坑分享

2023-09-19 23:09:28 1061

原创 Hadoop3.3.6

hadoop3.3.6安装和配置

2023-09-19 12:26:50 344

xinglu20的博客