程序员的三板斧
码龄8年
关注
提问 私信
  • 博客:70,082
    问答:157
    动态:248
    70,487
    总访问量
  • 47
    原创
  • 1,641,362
    排名
  • 331
    粉丝
  • 5
    铁粉

个人简介:一个人必须不停地写作,才能不被茫茫人海淹没。

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:江苏省
  • 加入CSDN时间: 2017-04-07
博客简介:

分享、总结

博客描述:
账号注册了很久,但是一直没下笔。。希望从今年(2022年)开始,我们一起进步~
查看详细资料
个人成就
  • 获得38次点赞
  • 内容获得38次评论
  • 获得145次收藏
  • 代码片获得330次分享
创作历程
  • 1篇
    2023年
  • 44篇
    2022年
  • 2篇
    2021年
成就勋章
TA的专栏
  • InfluxDB
    1篇
  • 🌿挑战100天不停更,刷爆 hive sql🧲
    35篇
  • hive
    3篇
  • linux
    1篇
  • mysql
    1篇
  • 离线数仓
    4篇
  • 开发工具
    2篇
  • spark总结
    1篇
  • spring
    1篇
兴趣领域 设置
  • Java
    spring
  • 大数据
    sqliteoracledatabasemysqlhbasehadoophiveredissparkflumerabbitmqmemcachebig dataflinknosql时序数据库数据库hdfsmapreduceclouderasqoop大数据etl
  • 前端
    react.js
  • 云原生
    zookeepereurekaconsul
  • 微软技术
    sql
  • 搜索
    elasticsearch
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

356人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

InfluxDB的查询优化

根据官网整理的Influx脚本的查询优化问题
原创
发布博客 2023.01.16 ·
8051 阅读 ·
2 点赞 ·
3 评论 ·
11 收藏

挑战100天不停更第35天 - 数字频率的中位数(+复盘)

🌿挑战100天不停更,刷爆 hive sql🧲详情请点击🔗我的专栏🖲,共同学习,一起进步~NUM: 第35天 - 数字频率的中位数我们昨天求的是薪水的中位数,今天再补充一种求中位数的方式,昨天可以通过三种方式,具体可以参考,昨天的链接: 挑战100天不停更hive sql第34天 - 薪水求中位数先看看表字段:number :数字frequency :数字的频率(注意:这里是频率,并不是数字, 所以不能根据这个字段排序)问题:求得number的中位数(需要通过frequency 字段
原创
发布博客 2022.05.16 ·
741 阅读 ·
0 点赞 ·
2 评论 ·
0 收藏

挑战100天不停更hive sql第34天 - 薪水求中位数

🌿挑战100天不停更,刷爆 hive sql🧲详情请点击🔗我的专栏🖲,共同学习,一起进步~文章目录🌿挑战100天不停更,刷爆 hive sql🧲NUM: 第34天 - 薪水求中位数🧨那就不废话了, 开始今天的刷题~~🧨🎈表结构🎉建表并插入数据👓问题:查询每个公司的薪水中位数查询结果🧨SQL关于sql的规范问题NUM: 第34天 - 薪水求中位数今天的sql是求中位数, 当然,我们第一眼看到这个问题的时候我们首先想到的是开窗函数row_number()根据公司名称分区,再将薪水排序,那么中位数怎么.
原创
发布博客 2022.05.12 ·
660 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

挑战100天不停更hive sql第33天 -游戏玩家-首日连续登陆占比

🌿挑战100天不停更,刷爆 hive sql🧲详情请点击🔗我的专栏🖲,共同学习,一起进步~NUM: 第33天 -游戏玩家-首日连续登陆占比我们之前写过关于访问的统计,活跃用户的统计,以及连续出现的值等先把链接贴出来挑战100天不停更第30天 -求连续出现的值 (lead()求的偏移量,再join即可)挑战100天不停更hive sql第27天 -活跃用户统计(row_number()打标求差值,然后分组)挑战100天不停更,刷爆 hive sql第26天 - 场景题-访问统计(累计访问 .
原创
发布博客 2022.05.11 ·
1159 阅读 ·
0 点赞 ·
2 评论 ·
3 收藏

挑战100天不停更第32天 -行程和用戶:查询乘客取消率(包含数值运算函数总结和in 、exits、 left join的效率对比)

🌿挑战100天不停更,刷爆 hive sql🧲详情请点击🔗我的专栏🖲,共同学习,一起进步~NUM: 第32天 -行程和用戶:查询乘客取消率(包含数值运算函数总结和in 、exits、 left join的效率对比)今天的sql是通过两张表,用户表,行程表, 计算行程的取消率, 注意:这里的取消率包含乘客和司机的取消率所用到的函数包括: sum() round() if()等今天主要复习两个问题:(由于内容比较多, 我放在文章后面~)一 关于数值的函数(25个)二 使用in() exit.
原创
发布博客 2022.05.10 ·
1158 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

挑战100天不停更hive sql第31天 -温度查找

🌿挑战100天不停更,刷爆 hive sql🧲详情请点击🔗我的专栏🖲,共同学习,一起进步~NUM: 第31天 -查找比前一天温度高的所有日期的ID查找前一天的数据一般都需要用到开窗函数lag(),取窗口的前一天数据,对开窗函数lag()不清楚的可以参考之前写过的sql,还有些取值相关的挑战100天不停更hive sql第20天时间序列-补全数据(取值相关函数有详细解释)这里再详细说一下关于lag()函数的传参问题lag(col,n,DEFAULT):用于统计窗口内往上第n行值默认的DEFA.
原创
发布博客 2022.05.07 ·
375 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

挑战100天不停更hive sql第30天 -求连续出现的值

🌿挑战100天不停更,刷爆 hive sql🧲详情请点击🔗我的专栏🖲,共同学习,一起进步~NUM: 第30天 -求连续出现的值最近一直在找题, 要么题重复了(连续登陆天数,累计求值什么的,这些都比较常见的), 都是以前总结的, 要么就是要收费的,这里给大家推荐一个网站,里面的题还是不错的, 但是需要会员才可以看答案,需要进阶的可以看下http://sqlintern.com/,大家有好的学习网站或者场景题也可以在下面留言哈~ 感谢~我自己思来想去, 觉得基础还是很重要的, 更要学会举一反.
原创
发布博客 2022.05.06 ·
1067 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

挑战100天不停更hive sql-第29天 -统计充值日志-使用`with as`

🌿挑战100天不停更,刷爆 hive sql🧲详情请点击🔗我的专栏🖲,共同学习,一起进步~NUM: 第29天 -统计充值日志-使用with as今天的日志统计要用到子查询 , 在实际工作中, 为了提高sql的课阅读性, 和运行效率, 我们经常会使用with as来将一个子查询引用,今天着重介绍下 with as的使用方法** ****什么是with as ?**公用表表达式(CTE)是从WITH子句中指定的简单查询派生的临时结果集(会把查询的表数据放到内存中,供其他查询随时使用)**怎么使用呢?.
原创
发布博客 2022.04.30 ·
1358 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

挑战100天不停更hive sql第28天-场景题-图书馆

🌿挑战100天不停更,刷爆 hive sql🧲详情请点击🔗我的专栏🖲,共同学习,一起进步~NUM: 第28天 -图书馆需求现有图书管理数据库的三个数据模型如下:图书(数据表名:BOOK)读者(数据表名:READER)借阅记录(数据表名:BORROW LOG)需求:(1) 创建图书管理库的图书、读者和借阅三个基本表的表结构。请写出建表语句。(2) 找出姓李的读者姓名(NAME)和所在单位(COMPANY)。(3) 查找“高等教育出版社”的所有图书名称(BOOK_NAME)及单价(P.
原创
发布博客 2022.04.30 ·
1673 阅读 ·
1 点赞 ·
0 评论 ·
9 收藏

挑战100天不停更hive sql第27天 -活跃用户统计

🌿挑战100天不停更,刷爆 hive sql🧲详情请点击🔗我的专栏🖲,共同学习,一起进步~NUM: 第27天 -活跃用户统计今天是关于活跃用户的统计问题, 所有用户及连续登陆两天的活跃用户,所有用户的活跃度比较简单,那连续两天活跃的用户要怎么求呢 ?这道题的核心在于: 日期减去行号 -->在分组-->判断是否>=2,那么就是活跃的用户,这个思想特别重要,之前写过的还有关于求绝对值去算最接近的, 这个: 挑战100天不停更hive sql第23天 - 非等值连接-最近匹配,大.
原创
发布博客 2022.04.27 ·
1169 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

挑战100天不停更hive sql 第25天 -场景题一 学生课程

🌿挑战100天不停更,刷爆 hive sql🧲详情请点击🔗我的专栏🖲,共同学习,一起进步~NUM: 第25天 -场景题一 学生课程最近两天天下班一直都在整理这套场景题,一共是50题,因为后面的比较简单,二十八后面的我就省略了(最后面我把问题贴出来), 表结构和数据我都写好了,可以直接复制, 由于篇幅比较长,本来我是想在前面贴导航的,但是无奈我是`markdown`,所以大家只能看边上的导航去筛选了先简单说一下吧:一共四张表, 学生 -成绩- 课程 - 老师 ,主要是用一些join,分组,排序.
原创
发布博客 2022.04.25 ·
1563 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

挑战100天不停更hive sql第24天 -累计去重

🌿挑战100天不停更,刷爆 hive sql🧲详情请点击🔗我的专栏🖲,共同学习,一起进步~NUM: 第24天 -累计去重去重? 我们一般会用到哪几个函数呢?dinstinct ``group by ``row_number()等等…那具体有什么区别呢?在实际的场景中又怎么选择呢??在数据量特别大的时候,又该如何调优呢 ?先刷题 , sql后面会细细来总结~🧨刷题~~🧨🎈表结构_1, __t24_为事件流水表,客户当天有一条记录则视为当天活跃🎉建表create .
原创
发布博客 2022.04.22 ·
2487 阅读 ·
4 点赞 ·
2 评论 ·
8 收藏

一步一个脚印,贵在坚持✊

发布动态 2022.04.22

挑战100天不停更hive sql第23天 - 非等值连接-最近匹配

🌿挑战100天不停更,刷爆 hive sql🧲详情请点击🔗我的专栏🖲,共同学习,一起进步~NUM: 第23天 - 非等值连接-最近匹配先说几个关键的函数,同学可以先思考下~rank() ?abs() ?思考五分钟~ 然后再接着往下看吧, 或许你已经有一个大概的思路了!!最近有个小小的总结: 看sql 不如写sql,当你面对一个自己完全没有思路,然后又用尽几乎所有办法时,才会发现每一个函数都有他的妙用之处! 才能真正的学会一个函数,也许sql看似简单, 但是,当你写sql的时候才会真正关.
原创
发布博客 2022.04.21 ·
558 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

挑战100天不停更hive sql 第22天- 非等值连接-范围匹配

🌿挑战100天不停更,刷爆 hive sql🧲详情请点击🔗我的专栏🖲,共同学习,一起进步~NUM: 第22天 - 非等值连接-范围匹配表 f 是事实表,表 d 是匹配表,在 hive 中如何将匹配表中的值关联到事实表中? 表 d 相当于拉链过的变化维,但日期范围可能是不全的。那我们要怎么匹配呢??🧨不废话,刷题~~🧨🎈表结构f:d:🎉建表-- 建表并插入数据-- 事实表create table f( date_id string, p_id st.
原创
发布博客 2022.04.20 ·
1550 阅读 ·
2 点赞 ·
2 评论 ·
4 收藏

挑战100天不停更hive sql 第21天 - 时间序列-取最新完成状态的前一个状态

🌿挑战100天不停更,刷爆 hive sql🧲详情请点击🔗我的专栏🖲,共同学习,一起进步~NUM: 第21天 - 时间序列-取最新完成状态的前一个状态当我们看到这道题目的时候首先会想到取最新的时间,然后用lead()开窗函数向下取一行,也许还有不同的解法,虽然sql并不长,但是我觉的有点绕,自己也写了很久,这道题也是非常考察对开窗取值函数的理解,特别是开窗中嵌套开窗, 就会有点绕,思路会断开🧨不废话,刷题~~🧨🎈表结构B为完整状态,A为未完成状态🎉建表-- 建表并插入数据cr.
原创
发布博客 2022.04.19 ·
514 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

挑战100天不停更hive sql第20天时间序列-补全数据

🌿挑战100天不停更,刷爆 hive sql🧲详情请点击🔗我的专栏🖲,共同学习,一起进步~NUM: 第20天 - 时间序列-补全数据怎么理解用最新的值来进行填充呢?打个比方, 有一张账单表,2017年是收入100块钱,2018年没收入,2019年收入200块钱,那么2018年的收入就为null,但其实真实的业务可能会出现2018年的收入其实和2017年收入一样,但是默认没有入库,那么我们需要手动去填充(类似的补全操作都是一样的)那具体怎么填充呢?下面的实现通过 开窗函数count()+fi.
原创
发布博客 2022.04.18 ·
1058 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

挑战100天不停更hive sql第19天 -时间序列,求最新值

🌿挑战100天不停更,刷爆 hive sql🧲详情请点击🔗我的专栏🖲,共同学习,一起进步~NUM: 第19天 -求最新值实际工作中,随着时间的不断推移,有些字段都在不断的变化和更新,不同的字段有不同的变化,并且时间不连续,那我们具体怎么求呢?请往下看🔽🧨不废话,刷题~~🧨🎈表结构🎉建表create table t19( date_id string, a string, b string, c string.
原创
发布博客 2022.04.17 ·
712 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

挑战100天不停更hive sql第18天 - 构造累计时间

🌿挑战100天不停更,刷爆 hive sql🧲NUM: 第18天 -构造累计时间为什么会构造累计时间呢? 因为有时候表的时间字段并不是连续的,又要根据时间对其他字段进行操作,这个时候就需要手动构造时间来解决问题,思路也很简单,用炸裂函数求出连续时间,并和原来的表进行关联后,再进行开窗即可🧨不废话,刷题~~🧨🎈表结构🎉建表create table t18( a string, b string, c int);insert into t18 (a, b.
原创
发布博客 2022.04.16 ·
379 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

挑战100天不停更hive sql第17天 -时间序列,构造时间累计

🌿挑战100天不停更,刷爆 hive sql🧲NUM: 第17天 -时间进行累计时间的问题需要对时间函数掌握的很全面,并且对时间的获取和转换流程很清楚,才能游刃有余解决问题,可以根据总的需求一步步的向下推,不断的寻求每个时间的解法🧨不废话,刷题~~🧨🎈表结构🎉建表-- 时间序列,构造累计时间--建表并插入数据create table t17( date_id string);insert into t17 (date_id)values ('2017-08-0.
原创
发布博客 2022.04.15 ·
405 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多