自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(56)
  • 资源 (4)
  • 问答 (5)
  • 收藏
  • 关注

原创 hiveSql 百度面试题-连续签到领金币

用户在文章页可以每天签到,签到按照某种规则可获取金币,需统计每个用户每月获取金币数。有用户签到明细表:记录用户进入签到页,点击签到按钮后退出log数据。部分表数据明细如下:领取金币规则:(1)只要用户签到就能获取一枚金币(2)连续签到第三天和第七天分别可以在每天一枚的基础上额外再获取2枚和6金币(3)连续签到7天后进行重置,按照规则(1)和(2)进行新一轮领币(4)用户进入时间和离开时间如果跨天 按照进入时间计算打卡时间上述举例明细中,用户id:1在2022-07-07到2022-07-15号连续

2023-01-06 20:05:57 621 1

原创 hiveSql 京东面试题-有效值问题

有入库成本表,一个商品每次入库就会产生一条数据,里面包含商品id,入库时间time,以及入库采购的成本。但由于某些某些原因,导致表中某些数据的成本是有丢失的。现在的逻辑是:当成本丢失时,有两种取成本的方式,现在需要把两种成本都取出来,最后取2次成本的平均值作为本次入库的成本。取数逻辑如下:具体数据如下:可见截图中商品id为2的商品在2022-12-02号和2022-12-03号的入库成本丢失,按照上述取数逻辑,会生成两个新的字段last_cost、next_cost。其中last_cost是当前丢失

2023-01-04 07:30:00 584

原创 hiveSql 构建连续日期

有如下数据期望构建如下数据:期望数据是将已有数据补齐2022-12-01到2022-12-07号日期,没有的日期value为0,然后计算每组id内的累加value值。从期望数据角度看,咱们如果有每组id的2022-12-01到2022-12-07的数据,作为主表left join已有数据,再一个sum()over() 就很简单了,关键在于如何构造连续日期。构造连续日期,且分成多行很容易想到利用repeat()函数,和posexplode()拆分重复的字符串,构建多行带索引的数据。再利用行索引与2022-1

2022-12-29 23:15:00 705 2

原创 hiveSql 重分组聚合问题

将下图中A表转变为B和C,即A->B A->C2)第二种分析思路解法:此处利用repeat()方法,重复name分组个数,按照空格连接,但是最后会多出一个空格,利用trim()将前后空格去除,再将空格替换为竖线连接name即可结果:结果:喜欢的点赞、关注、收藏吧~ 你的支持是最大的创作动力~~

2022-12-28 23:53:07 588 1

原创 hiveSql 连续区间的起始结束位置

有登录日志,求每个用户的每次连续登录的起始和结束日期有用户登录日志如下:表:user_login,userid:用户id,date:登录日期为了简化说明这里date日期用数字表示。这里需求想要最终结果为:连续时间的起始,结束日期到这里可以先思考下如何用hivesql实现很明显这里是利用重分组思想,将连续的日期分到同一组之后,取组内的最大最小值即可最后喜欢的点赞、关注、收藏吧~ 感谢支持~~

2022-12-07 00:47:23 285

原创 hiveSql冷门但好用函数 --持续更新

hiveSql冷门但好用函数 --持续更新

2022-11-30 19:39:57 3348

原创 hiveSql 相互关注问题

hiveSql 优化的解决相互关注问题

2022-11-28 23:12:01 1728 3

原创 hiveSql 跨N天最大连续统计

hiveSql 跨N天最大连续统计

2022-11-17 13:13:44 631

原创 hiveSql 各时段观看直播人数

各时段观看直播人数

2022-11-14 14:01:24 1124

原创 shell学习-运算符

shell运算符概览

2022-07-20 01:08:36 118

原创 hiveSql 计算两段时间范围交集的连续每月天数

HQL计算两段时间范围交集的连续每月天数

2022-07-17 19:27:18 1160

原创 shell学习-变量

shell3种变量

2022-07-13 01:00:47 77

原创 linux学习-vim编辑器

vim3种模式下常用命令及操作一文解读

2022-06-12 18:05:46 286 2

原创 13Python基础-总结(五子棋小游戏)

据说五子棋有必胜落子法?我不信!用python实现五子棋小游戏!

2022-04-06 01:00:19 2440 3

原创 12Python基础-集合Set

打团了!请求集合?快看看python 中的集合如何理解!

2022-04-03 18:05:36 1801 1

原创 hiveSql完成递归计算2.0

hiveSql实现递归思想,计算数据

2022-03-31 07:00:00 4818 15

原创 11Python基础-字典Dict

在Python中查字典?原来python字典如此简单!

2022-03-26 17:27:01 1250

原创 10Python基础-元组Tuple

一起了解特殊的列表 -- 元组 Tuple

2022-03-26 13:36:50 1113

原创 09Python基础-列表List

一文掌握python3列表的基础知识与使用,满满干货~

2022-03-21 07:00:00 1768

原创 08Python基础-函数

一文掌握python3函数知识点,全是干货没有一滴水~

2022-03-16 07:00:00 1684 2

原创 07Python基础-循环

python流程控制之循环

2022-03-13 19:18:47 1566

原创 06Python基础-流程控制if

流程控制之if判断

2022-03-13 07:00:00 927

原创 05Python基础-运算符

一文了掌握Python常用运算符使用及原理运算符种类符号代码示例运算结果备注说明加+print(1+2)3两数相加减-print(1-2)-1两数相减乘*print(1*2)2两数相乘除/print(1/2)0.5两数相除取整除//print(3//2)1只保留整数部分,不四舍五入取余(取模

2022-02-27 00:31:45 824

原创 04Python基础-基本数据类型-字符串

一文轻松掌握python字符串常用方法

2022-02-21 01:22:05 894

原创 Hive Sql完成过滤每组累积去重数低于某值计算

如何一条sql搞定限定组内截止去重数?

2022-02-20 12:39:50 2605

原创 03Python基础-基本数据类型

Python基本数据类型前言什么是数据为什么数据要区分不同类型python基本数据类型1.数字类型整型 intfloat 浮点型其他数据类型(了解)数字类型的使用2.字符串类型str字符串的使用3.列表 list4.字典dict5.元组tuple6.集合set7.布尔类型bool前言变量是为了让计算机能够像人一样去记忆事物的某种状态,而变量的值就是用来存储事物状态的,很明显事物的状态分成不同种类的(比如人的年龄,身高,职位,工资等等),所以变量值也应该有不同的类型。下面来逐步介绍Pyhton中常用的几种

2022-02-08 00:01:51 521

原创 02Python基础-变量、常量

变量什么是变量变量就是可以变化的量量指的是事物的状态,通过给变量赋值,也将数据与一些能够描述的名字连接起来,简单说,就是给数据一个能让人理解的名字,12可以指年龄,也可以指距离,所以,需要通过这个定义,12就有了不同的含义。变量的值,最终是存储在内存中变量的作用变量的主要作用,就是用来存储信息,然后在计算机程序中使用这些信息。为了让计算机能够像人一样去记忆事物的某种状态,并且状态是可以发生变化的。定义变量变量名 = 值1 变量名:是用来访问变量值的2 赋值符号:把值的内存地址绑定给变

2022-01-25 08:00:00 732 1

原创 01Python基础-注释

什么是注释注释就是对代码的解释说明,注释的内容不会被当做代码运行为啥要注释当代码逻辑复杂,或编写代码供其他人使用时,可以添加注释,增强代码的可读性怎么使用注释单行注释单行注释用#号,注释可以放在代码的正上方或者正后方多行注释多行注释可以用三对双引号""" “”"注释使用注意不是所有地方,每一行都要添加注释,容易适得其反注释可以用中文或英文,但不要用拼音注释示例#这是一个单行注释print("我是单行注释!");"""这是一个多行注释,可以换行注释1注释2...

2022-01-21 08:00:00 699

原创 常用类及方法(持续更新)

java常用类及其方法,持续更新哦~

2021-12-09 00:42:16 141 2

原创 hiveSql 实现计算用户的最大连续登录天数 & 创建断连后的连续序号

这里写目录标题1.需求一:1.1.已有数据1.2.期望结果1.3.分析1.4.实现2.需求二2.1.已有数据2.2.期望结果2.3.分析2.4.实现方式一2.5.实现方式二1.需求一:计算每个用户在一段时间内的最大连续登录天数1.1.已有数据usernamelogintimeA2021-10-01A2021-10-02A2021-10-03A2021-10-05A2021-10-06A2021-10-09B2021-10-01

2021-10-22 16:59:06 3484 2

原创 2021-06-06 每日一题(整数反转)

目录上期链接自己答案答案其他答案本期问题示例限制回答上期链接自己答案答案其他答案本期问题示例限制回答

2021-06-06 20:22:05 65 1

原创 2021-06-05 每日一题(Z字形变换)

目录上期链接自己答案答案其他答案本期问题示例限制回答上期链接自己答案答案其他答案本期问题示例限制回答

2021-06-06 20:11:30 74 1

原创 2021-06-04 每日一题(最长回文子串)

目录上期链接自己答案答案其他答案本期问题示例限制回答上期链接自己答案答案其他答案本期问题示例限制回答

2021-06-06 19:31:51 136 5

原创 2021-06-03 每日一题(无重复字符的最长子串)

目录上期链接自己答案答案其他答案本期问题示例限制回答上期链接自己答案答案其他答案本期问题示例限制回答

2021-06-06 17:34:52 81

原创 2021-06-02 每日一题(两数之和)

目录上期链接自己答案官方答案其他答案本期问题示例限制回答上期链接2021-06-01每日一题(机器人的运动范围)自己答案官方答案其他答案本期问题示例限制回答

2021-06-02 16:42:16 96 1

原创 2021-06-01每日一题(机器人的运动范围)

目录上期链接自己答案官方答案其他答案本期问题示例限制回答上期链接自己答案官方答案其他答案本期问题示例限制回答

2021-05-31 18:39:48 102

原创 2021-05-31 每日一题(矩阵中的路径)

目录上期链接自己答案官方答案其他答案本期问题示例限制回答上期链接自己答案官方答案其他答案本期问题示例限制回答

2021-05-30 23:23:44 71

原创 2021-05-30 每日一题(旋转数组的最小数字)

目录上期链接自己答案官方答案其他答案本期问题示例限制回答上期链接自己答案官方答案其他答案本期问题示例限制回答

2021-05-30 22:53:58 77 1

原创 2021-05-29 每日一题(青蛙跳台阶问题)

目录上期链接自己答案官方答案其他答案本期问题示例限制回答上期链接自己答案题目上说是从0开始的斐波那契数列,即0,1,1,2,3,5,8,13,21,34,55…利用递归方式求的该数列的第N位数的值。若从1开始,则为注释部分。public int fib(int n) { if (n == 0 || n == 1 || n == 2) { return (int) Math.floor(n/2);// if ( n == 1 || n ==

2021-05-30 22:33:23 114

原创 2021-05-28 每日一题(斐波那契数列)

目录上期链接自己答案官方答案其他答案本期问题示例限制回答上期链接自己答案官方答案其他答案本期问题示例限制回答

2021-05-27 19:54:06 188

hive搭建及使用入门简介(内含PPT、各种表创建sql及hive搭建使用笔记)

适用人群:hive学习童鞋,hive方面从业人员 从hive的搭建 到 hive的分区表/内部表/外部表/分桶等sql讲解

2022-03-08

git命令学习.txt

常用的git命令及git学习网址

2021-07-15

hive函数参考手册,包含常用的hive内置函数.doc

hive常用内置函数使用文档,类似于java的api doc文档

2019-09-24

scala基础(包含安装步骤)scala.txt

初学时候,一个字一个字敲出来的总结哦!包括scala安装步骤,scala基础语法,和一些基本的api,类似于javase部分

2019-09-24

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除