自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 HiveSQL的核心语法

本文详细介绍了HiveSQL的核心查询语法与大数据特性。第一部分讲解五大基础子句(FROM/WHERE/GROUPBY/HAVING/SELECT)的执行逻辑和示例用法;第二部分分析Hive特有的四种排序方式(ORDERBY/SORTBY/DISTRIBUTEBY/CLUSTERBY)及高级查询(子查询/CTE/窗口函数);第三部分重点说明HiveJOIN与标准SQL的区别,包括内连接、左连接、左半连接等实现方式及分布式优化特性。全文通过学生信息表和成绩表的实践案例,系统阐述了HiveSQL在大数据环境下的

2025-11-17 23:13:49 1108

原创 浮点数计算误差的四大具体表现及实例解析

浮点数计算误差的所有表现,本质上都可归结为 “二进制有限精度无法精确表示所有十进制小数” 这一底层矛盾。存储型误差:数值本身在二进制转换时因截断产生的初始误差(如 0.1 的近似存储);运算型误差:运算过程中因指数对齐、尾数截断、舍入等操作引入的附加误差(如加法对阶、乘法尾数扩展)。理解这些表现形式,是后续选择 “设置误差范围比较”“使用高精度库” 等解决方案的前提 —— 只有明确误差的来源和形态,才能针对性地规避其对程序逻辑的影响。

2025-09-11 13:00:05 1497

原创 SQL巧解用户最大连续登录天数

去重排序:确保每个用户每天只算 1 次登录,并按日期编号。分组标识:通过 “日期 - 序号” 的固定差值,识别连续日期组。统计最大:计算每组的连续天数,取最大值即为结果。此方法适用于支持窗口函数的数据库(如 MySQL 8.0+、PostgreSQL、Oracle 等)

2025-08-15 15:01:09 587 1

原创 SQL字符串函数总结及示例,及substring_index()函数讲解

以上函数覆盖了字符串的长度计算、拼接、截取、清洗、转换等常见操作。不同数据库对函数的支持略有差异(如函数名称或参数顺序),实际使用时需根据数据库类型(MySQL、SQL Server、PostgreSQL 等)调整语法。sql-- 取逗号分隔的最后2个元素SELECT结果fruit_list以上函数覆盖了字符串的长度计算、拼接、截取、清洗、转换等常见操作。

2025-08-13 10:44:04 1755

原创 sql中计算次日留存率

sql中计算次日留存率

2025-08-12 20:09:32 1958

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除