自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 DataGrip或者intellijIDEA 远程链接数据库的时候下载驱动失败 出现错误:https://download.jetbrains.com/idea/jdbc-drivers/Redis/

本人使用DataGrip版本:2023.1在链接数据库的时候出现这个错误,无法完全加载驱动,是因为这里的maven仓库下载驱动失败,这时候需要自己手动下载驱动。

2024-09-12 19:24:59 212

原创 spoon、mysql数据导入hive,分别使用hdfs导入,或者修改配置

通过sqoon将mysql的数据导入hive的两种方法

2024-09-12 19:11:09 421

原创 Hive的集群的搭建-内嵌模式-本地模式-远程链接

Hive 是一个框架,可以通过编写sql的方式,自动的编译为MR任务的一个工具Hive是一个数据仓库工,可以将数据加载到表中,编写sql进行分析,底层依赖Hadoop,所以每一次都需要启动hadoop(hdfs以及yarn),Hive的底层计算框架可以使用MR、也可以使用Spark、TEZ,Hive不是数据库,而是一个将MR包了一层壳儿。类似于一个中介。

2024-09-10 19:05:45 1216

原创 DolphinScheduler(海豚调度器)安装与试玩一下

DolphinScheduler部署

2024-09-09 19:37:06 1186

原创 Hive的一些基本函数(二)

如果不能平均分配,则优先分配较小编号的桶,并且各个桶中能放的行数最多相差1。row_number从1开始,按照顺序,生成分组内记录的序列,row_number()的值不会存在重复,当排序的值相同时,按照表中记录的顺序进行排列。在over窗口中进行分组,对某一字段进行分组统计,窗口大小就是同一个组的所有记录(按照所给字段分组)当查询的要求,既要明细查询又要统计查询的时候,这时候考虑开窗,通过over语法让两种查询同时执行。需求:获取一个表中,所有消费记录中,每一个人,最后50%的消费记录。

2024-09-07 14:25:47 387

原创 Hive 的一些基本函数(一)

hive 中的一些基本函数,常用的使用方法

2024-09-07 11:05:28 536

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除