自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 收藏
  • 关注

原创 Structured Streaming基本使用

Structured Streaming基本使用

2023-11-08 19:45:11 133

原创 编写sql实现每个用户截止到每月为止的最大单月访问次数和累计到该月的总访问次数

编写sql实现每个用户截止到每月为止的最大单月访问次数和累计到该月的总访问次数

2023-11-07 11:24:54 215

原创 Kafka架构

Kafka架构

2023-11-05 20:24:20 92

原创 数仓ods层对于缺失、重复、错误值的处理

数仓ods层对于重复、缺失、错误值的处理

2023-11-03 18:02:39 155

原创 spark sql和hive sql 的对比

spark sql 和 hive sql的对比

2023-11-02 21:00:10 228

原创 spark中的rdd算子应用

用spark中rdd算子实现词频统计

2023-10-31 16:27:44 22

原创 mysql和oracle的区别

mysql和oracle的区别

2023-10-25 11:40:06 52

原创 数据类型与数据结构区别

数据结构和数据类型分别举例

2023-10-25 10:54:46 45

原创 简单的查找算法

查找算法

2023-10-25 10:31:55 29

原创 简单排序算法

介绍了几种基本的排序算法

2023-10-24 21:00:29 33

原创 python对于异常的处理

在python开发中,对于异常的处理

2023-10-06 21:10:45 38 1

原创 python中文件的基本操作

python中文件的基本操作

2023-10-06 20:34:11 35 1

原创 元组、字典、字符串、列表、集合数据类型的区别

需要注意的是,元组、字符串和列表都是序列类型,可以通过索引和切片进行访问和操作。字典和集合是无序的,不能通过索引访问,而是通过键进行访问。此外,元组和字符串是不可变的,即创建后不能进行修改,而字典、列表和集合是可变的,可以动态添加、删除和修改元素。

2023-09-27 20:58:49 315

原创 探索Shell:强大的命令行工具和脚本语言

探索Shell:强大的命令行工具和脚本语言

2023-09-21 20:41:48 152 1

原创 Hive 数据库索引解析:提升查询速度的方法

Hive 数据库索引解析:提升查询速度的方法

2023-09-20 20:00:56 218 1

原创 解决hive中数据倾斜问题

数据倾斜主要指:每个reduce拿到的数据量并不均衡。如何发现:查看每一个reduceTask执行时间,大部分的reduceTask都执行完成了, 只有其中一个或者几个没有执行完成, 此时认为发生了数据倾斜

2023-09-20 09:48:17 498 1

原创 sql 求最大连续登录问题

求员工最大连续签到,或者连续登录问题,解决方案

2023-09-16 15:45:45 92 1

原创 分桶表优化:高效数据抽取与查询性能提升

高效数据抽取与查询:分桶表的优化策略

2023-09-14 19:57:15 88 1

原创 使用分桶表进行数据抽样:一种高效的数据分析技术

在数据分析中使用分桶表进行数据抽样

2023-09-13 16:29:35 86

原创 在数据仓库中拉链表的使用

学会使用拉链表,解决数据仓库中历史时间变化问题

2023-09-13 11:18:38 245

原创 解决sqoop导入数据倾斜的问题

开发中遇到的sqoop导入数据倾斜问题

2023-09-12 20:43:17 140

原创 求N日存留率问题

留存率是指在某一时间段内,用户继续使用产品或服务的比例。计算n日留存率的方法是,首先选择一个起始日期作为基准日期,然后计算从该日期起,经过n天后仍然使用产品或服务的用户数量占比。

2023-09-12 20:05:16 19

原创 使用SQL Range操作符进行高级数据分析和筛选

求近三天销售额总和(前两天 + 今天),此时分两种情况,一种是每天都有销售额,第二种是中间某天没有销售额

2023-09-08 10:43:17 271 1

原创 insert overwrite table:数据仓库和数据分析中的常用技术

"INSERT OVERWRITE TABLE:清空和重新加载表中的数据"

2023-09-06 20:16:18 7213 3

原创 解决hive中注释乱码问题

解决hive中注释乱码问题

2023-09-04 20:02:47 103 1

原创 zookeeper基础

快速了解zookeeper

2023-08-30 20:14:32 46 1

原创 hdfs和hive中的元数据区别

hdfs和hive中元数据的区别

2023-08-30 20:08:35 98 1

原创 五分钟上手finebi

五分钟上手finebi

2023-08-18 13:57:19 192

原创 Kettle简单操作

ETL实用工具,轻松上手kettle

2023-08-17 19:42:26 393

原创 Linux基础学习

轻松学习linux安装和基础指令

2023-08-16 21:31:13 25 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除