自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 离线数仓搭建

1.先执行到这两个线条上面,然后上传date_info.txt到/warehouse/gmall/tmp/tmp_dim_date_info。注意:对自己机器有信心的话,直接执行脚本,没信心的话,执行一个,重启或者等待几分钟执行下一个。这三个不用管,所以开始前我们需要确定有这些文件和配置。上传base.txt到任意目录下,且cd到该目录。到后面将时间修改为06,07分别运行lg.sh。等吧,每个半个小时起步或者一个小时,是搞不定的。多出来13张表,也就是说,现在有30张表。执行两次就到我们需要的位置。

2024-06-16 15:43:59 999

原创 使用Flink进行股票计算

在每个分区上,我们定义一个滑动窗口,窗口大小为60秒,然后使用AggregateFunction进行聚合计算。通过这个流程,我们可以实时计算每个股票代码在每分钟内的平均交易价格,为股票交易提供有价值的信息。这个程序的主要目的是读取股票数据,按照股票代码进行分组,然后在每个 60 秒的窗口内计算每种股票的平均价格,并打印到控制台。在这个类中,实现了 apply 方法,这是窗口函数的核心方法,它会在每个窗口结束时被调用。是一个辅助方法,用于将形式为 “HHmmss” 的时间字符串解析为一天中的秒数。

2024-06-16 15:39:45 1018

原创 Flink端到端的精确一次

这行代码启用了检查点,并设置了检查点的模式为精准一次。检查点间隔为5000毫秒。这行代码创建了一个Flink执行环境,它是所有Flink程序的开始。这行代码设置了检查点的存储路径,这里我们选择了HDFS作为存储介质。1.hadoop,zookeeper和kafka启动。只需要在实验一的基础上修改kafkf消费主题命令就行。3.创建对应需要的kafka主题。2.创建flink需要的存档点。更具代码的路径创建对应的目录。同KafkaEOSDemo。

2024-06-16 15:37:42 665

原创 阿里云安装Hadoop全家桶

使用阿里云服务器 安装 hadoop Hive Flume kafka zookeeper mysql等内容,教程从头开始且详细详细

2024-03-23 15:39:47 927 1

原创 Hadoop3.3.6安装和配置hbase-2.5.5-hadoop3x,zookeeper-3.8.3

/修改 zoo.cfg 配置文件,将 dataDir=/data/zookeeper/data 修改为指定的data目录。重点:以下配置都是在root用户下进行配置后续会给对应的hadoop用户权限。推荐一口气配置完在进行给予权限和进行配置文件的刷新,以及最后的分发。在安装过程中推荐设置root用户密码为1234方面后续操作。权限 给 hadoop 用户配置相关权限。hadoop2,3分别创建软连接。hadoop2,3创建软连接。hadoop2 修改为2。hadoop3 修改为3。以hadoop3为例。

2023-11-21 21:46:03 2583 3

原创 Scrapy框架学习

对Scrapy框架学习以及自己的经验和踩坑分享

2023-09-19 23:09:28 1061

原创 Hadoop3.3.6

hadoop3.3.6安装和配置

2023-09-19 12:26:50 344

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除