夏木夕-CSDN博客

原创 SQL面试题练习 —— 有序行转列

有学生各学科分数表，记录了学生的各科分数，请按照学生粒度，生成两列数据分别为学科和分数，要求学科内的顺序与分数顺序一致。使用collect_list函数，将数据进行行转列，得到数组。注意：不同学科顺序是不能保证有序的，有序是巧合。使用struct将学科和成绩转换为结构体，这样绑定了学科和成绩。

2024-08-12 15:28:04 722 1

现有奖金池为 10000元，代表奖金池中的初始额度。表中的数据代表每一个用户和其对应的得分，user_id 和 score 都不会有重复值。瓜分奖金的规则如下：按照 score 从高到低依次瓜分，每个人都能分走当前奖金池里面剩余奖金的一半，当奖金池里面剩余的奖金少于 250 时（不含），则停止瓜分奖金。现在需要查询出所有分到奖金的 user_id 和其对应的奖金。题目中要求：当奖金池里面剩余的奖金少于 250 时（不含），则停止瓜分奖金。如果无限瓜分下去，看下是什么结果。，排名 rn 的得到的为。

2024-08-08 13:38:12 964

原创 SQL面试题练习 —— 计算用户首单是即时单的比例

题目来源：美团。

2024-08-08 13:17:02 777

原创大数据技术学习笔记（十）—— Hive（2）

Hive自带了一些函数，比如：max/min等，但是数量有限，自己可以通过自定义UDF来方便的扩展。当Hive提供的内置函数无法满足你的业务处理需要时，此时就可以考虑使用用户自定义函数（UDF：user-defined function）。一进一出。用户自定义聚合函数，多进一出。类似于：count/max/min用户自定义表生成函数，一进多出。如：lateral view explode()编程步骤：（1）继承Hive提供的类（2）重写类中的抽象方法。

2024-08-06 16:59:35 1374

原创 SQL面试题练习 —— 统计最大连续登录天数区间

【代码】SQL面试题练习 —— 统计最大连续登录天数区间。

2024-07-17 22:51:39 726

原创 SQL面试题练习 —— 查询每个用户最大连续登录天数

（3）按照 diff 分组，获取每个用户每次连续登录的天数。（2）利用等差数列的特性，如果是连续登录，（4）得出每个用户最大连续登录天数。查询每个用户最大连续登录天数。

2024-07-17 21:01:45 3027

原创 SQL面试题练习 —— 各用户最长的连续登录天数-可间断

现要求统计各用户最长的连续登录天数，间断一天也算作连续，例如：一个用户在1,3,5,6登录，则视为连续6天登录。首先根据user_id和group_id分组，用datediff计算出出最大登陆日期和最小登陆日期，两者做差+1 得到每次连续登陆的天数。根据用户分组，使用lag函数获得当前行的上一行数据中的日期，使用datediff函数判断日期当期日期与上一行日期的时间差。根据date_diff结果判断是否连续，如果date_diff <= 2则认为连续我们给赋值为0，否则不连续，赋值为1。

2024-07-06 00:33:08 873

原创 SQL面试题练习 —— 连续签到领金币

题目来源：百度。

2024-07-04 18:05:03 813

原创 SQL面试题练习 —— 找出所有连续未登录5天及以上的用户并提取出这些用户最近一次登录的日期

找出所有连续未登录5天及以上的用户并提取出这些用户最近一次登录的日期。

2024-07-04 17:41:40 558

原创 SQL面试题练习 —— 查询每个学科第三名的学生的学科成绩总成绩及总排名

有学生成绩表，包含学生姓名、学科、成绩三个字段，请用一条SQL查询出每个学科排名第三名的学生，他的学科成绩、总成绩、以及总排名。样例数据。

2024-07-04 16:54:27 741

原创 SQL面试题练习 —— 查询前2大和前2小用户并有序拼接

根据年份分组，取出每年最大、第二大，最小、第二小用户ID。使用 if 对desc_rn，rn进行判断，对符合条件的数据取出 user_id，其他去null，然后使用聚合函数取出结果。有用户账户表，包含年份，用户id和值,请按照年份分组，取出值前两小和前两大对应的用户id，需要保持值最小和最大的用户id排首位。（2）根据年份分组，取出value最大user_id，第二大user_id，最小user_id，第二小user_id。（3）按照顺序拼接，得到最终结果。按照题目要求，进行字符拼接。

2024-07-01 16:59:33 455

原创 SQL面试题练习 —— 微信运动步数在好友中的排名

题目来源：腾讯。

2024-06-28 12:04:19 657

原创 SQL面试题练习 —— 计算每个用户的受欢迎程度

题目来源：meta。

2024-06-28 11:54:43 300

原创 SQL面试题练习 —— 查询最近一笔有效订单

题目来源：字节跳动。

2024-06-28 11:44:20 670

原创 SQL面试题练习 —— 查询每个产品每年总销售额

我们先观察2中的结果，可以看到原始记录中每行数据都与所有年都有一行记录。我们从销售日期和每年开始日期中取较大日期得到一个开始时间，然后从销售截止日期和每年的结束日期取较小日期得到一个结束日期，然后用结束日期减去开始日期。但是这个date_diff 的值比预期小1，这是因为我们算了日期差，所以我们在结果上+1即可。已知有表 t_product_sales 如下，记录了每个产品id、产品名称、产品销售开始日期、产品销售结束日期以及产品日均销售金额，请计算出每个产品每年的销售金额。

2024-06-28 10:57:27 902

原创 SQL面试题练习 —— 共同使用ip用户检测问题

题目来源：字节跳动。

2024-06-27 17:32:18 433

原创 SQL面试题练习 —— 无效搜索

题目来源：百度。

2024-06-27 17:16:08 489

原创 SQL面试题练习 —— 查询每个用户的第一条和最后一条记录

题目来源：小红书。

2024-06-27 16:43:53 643

原创 SQL面试题练习 —— 求连续段的起始位置和结束位置

题目来源：拼多多。

2024-06-27 16:35:00 541

原创 SQL面试题练习 —— 用户中两人一定认识的组合数

题目来源：快手。

2024-06-27 16:17:41 290

原创 SQL面试题练习 —— 合并用户浏览行为

使用sum()over(partition by ……order by。)累加计算，给出组ID。聚合函数开窗使用order by 计算结果是从分组开始计算到当前行的结果。有一份用户访问记录表，记录用户id和访问时间，如果用户访问时间间隔小于60s则认为时一次浏览，请合并用户的浏览行为；（1）分用户计算出每次点击时间差。（2）确认是否是新的访问。

2024-06-27 12:15:09 451

原创 SQL面试题练习 —— 截止目前登陆用户数及登陆用户列表

题目来源：滴滴。

2024-06-27 12:00:17 424 1

原创 Redis 学习笔记（2）

事务是数据库操作的最小工作单元，包含原子性、一致性、隔离性、持久性。

2024-06-23 12:46:44 1445

原创 Redis 学习笔记（1）

NoSQL最常见的解释是“non-relational”，很多人也说它是“Not Only SQL”。NoSQL仅仅是一个概念，泛指非关系型的数据库。区别于关系数据库，它们不保证关系数据的ACID特性。Redis是当前比较热门的NoSQL系统之一。它是一个开源的、使用ANSIC语言编写的key-value存储系统（区别于MySQL的二维表格形式存储）。

2024-06-23 12:46:26 902

原创 Redis 的安装与部署

上传 redis-3.2.8 源码到 /opt/software/ps: 是一个用于显示当前运行进程的命令。本文为Redis的Linux版单机部署。查找正在运行的与redis相关的进程。解压到 /opt/module/方式三：通过客户端命令进行关闭。Redis是C语言编写的。方式二：Linux命令行。

2024-06-22 10:38:52 482

原创一、基础数据结构之双指针

如果数组的数值可以取负数，是不能使用双指针来求最优解的，就是因为不满足单调性，这种题目其实比较难的是一种抽象问题的能力，有的题目需要把问题做一个转化，首先需要判断，如果满足，就需要把问题转化为一个可以使用双指针去解决的一个滑动窗口问题。

2024-06-11 15:33:59 1295

原创 2. 基础数据结构之哈希表

哈希表是由多个key-value对来组成的，它有两个重要性质O1keyvalue哈希表还可以去帮助实现离散化：差分专题中的离散化差分就是借助有序的哈希表来实现的，有序哈希表指的是key有序，而不是value有序，key是按照从小到大递增存储的，因此遍历有序哈希表的key是递增的。

2024-06-11 15:33:33 1203

原创 SQL面试题练习 —— 求连续段的最后一个数及每个连续段的个数

题目来源：拼多多。

2024-06-07 17:37:14 557

原创 SQL面试题练习 —— 累加刚好超过各省GDP40%的地市名称

江苏省的苏州19% 南京 14% 无锡 12%，苏州+南京=33% ，苏州+南京+无锡=45%，取出苏州、南京、无锡。现有各省地级市的gdp数据，求从高到底累加刚好超过各省GDP40%的地市名称，临界地市也需要。浙江省的杭州24% 宁波 20% ,杭州+宁波=44% 大于40% 取出杭州、宁波。：求取累加求和

2024-06-07 17:09:04 558

原创 SQL面试题练习 —— 占据好友封面个数

题目来源：腾讯。

2024-06-07 11:07:59 499

原创 SQL面试题练习 —— 向用户推荐好友喜欢的音乐

根据用户关注表和用户喜欢的音乐表进行关联，查询出每个用户关注用户喜欢的音乐ID，再筛选出用户1关注用户喜欢的音乐ID；记录用户ID及其关注的人ID，请给用户1 推荐他关注的用户喜欢的音乐名称。：行转列并对重复的音乐名称去重，得到最终结果。：关联音乐名字表，关联出对应的音乐名称；

2024-06-06 16:11:40 489

原创 SQL面试题练习 —— 合并活动日期

已知有表记录了每个大厅的活动开始日期和结束日期，每个大厅可以有多个活动。请编写一个SQL查询合并在同一个大厅举行的所有重叠的活动，如果两个活动至少有一天相同，那他们就是重叠的，请将他们的交叉的日期合并。代表有交叉，可以合并，否则代表不可合并。判断出是否可以合并之后，具体操作合并就转化成类似连续问题了。的最大值作为活动结束日期，得到最终结果。重叠，我们将它们合并到一个活动中。进行了升序排列，所以当前行的。函数进行开窗，取到上一行的。的最小值作为活动开始日期，，我们只需要对当前行的。进行比较，如果当前行的。

2024-05-23 11:49:47 736

原创 SQL面试题练习 —— 部门人员数据分析

题目来源：三一重工。

2024-05-22 19:52:53 415 1

原创 SQL面试题练习 —— 合并数据

题目来源：京东。

2024-05-22 19:16:54 480

原创 SQL面试题练习 —— 互相关注

现有用户关注者列表记录表，有两个字段，用户ID（user_id），关注者列表（。

2024-05-22 18:11:13 972

原创 SQL面试题练习 —— 用户商品购买收藏行为特征加工

购买记录表t_order,包含自增id:id,用户ID:user_id，商品ID:goods_id,订单时间：order_time,商品类别：goods_type;请用一句 sql 语句得出以下查询结果，得到。

2024-05-22 15:35:16 303

原创 SQL面试题练习 —— 取出累计值与1000差值最小的记录

已知有表 t_cost_detail 包含 id 和 money 两列，id 为自增，请累加计算money 值，并求出累加值与 1000 差值最小的记录。

2024-05-22 14:55:04 342

网络编程用到的网络调试助手工具

2024-05-14

Java的日志配置文件 logback.xml

2023-08-19

目标检测人物是否佩戴安全帽数据集

安全帽数据集共含有 6696 张图片，以及对应的 6696 个 VOC 格式的 xml 标注文件，以下四个python脚本文件作用分别是对voc格式的xml标注文件进行转换yolo格式的txt文件，以及按照比例划分数据集。文件目录结构： ├───DataProcessing │ └───VOCdevkit │ └───VOC2007 │ ├───Annotations │ ├───ImageSets │ └───JPEGImages ├───split82.py ├───split721.py ├───Voc2Yolo.py ├───Yolo2Voc.py

2023-07-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人