自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 题十四:查找接口成功率最优时间段

说明:minAveragerLost=2,数组[0,0,100,2,2,99,0,2] 通过计算小于等于2的最长时段为数组下标为0-1即[0,0],数组下标为3-4即[2,2]数组下标为6-7即[0,2],这三部分都满足平均值小于2的要求因此输出0-1 3-4 6-7。输入有两行内容,第一行为{minAverageLost},第二行为{数组},数组元素通过空格(” “)分隔,minAverageLost及数组中元素取值范围为0~100的整数,数组元素的个数不会超过100个。输出 0-2。

2024-04-30 14:42:21 112

原创 题十二:部门人力分布

当前部门需要完成 N 个需求,需求用 requirements 表述,requirements[i] 表示第 i 个需求的工作量大小,单位:人月。1. 需求开发任务:存在 N 个需求开发任务,每个任务的工作量用一个数组 requirements 来表示,其中 requirements[i] 是第 i 个需求的工作量。当选择人力为6时,2个需求量为3的工作可以在1个月里完成,其他2个工作各需要1个月完成。可以在3个月内完成所有需求。当选择人力为5时,4个工作各需要1个月完成,一共需要4个月才能完成所有需求。

2024-04-17 10:53:03 413

原创 题十一:Wonderland

核心思想是为每个游玩日期计算最低消费成本,并存储这些结果以供后续日期使用。根据售票价格数组和游玩日期数组给出的信息,发现每次去玩的时候买一张一日票是最省钱的,所以小王会卖。现在,请您根据给出地售票价格数组和小王计划游玩日期数组,返回游玩计划所需要地最低消费。每种售票方式的价格由一个数组给出,每种票据在票面时限内可以无限制地进行游玩。小王计划地游玩日期将由一个数组给出。如果这一天不在计划游玩日期中,则这一天的消费与前一天相同,即。,默认顺序为一日票、三日票、周票和月票。完成游玩计划的最低消费。

2024-04-17 00:21:27 430

原创 题十:MELON的难题

定义一个动态规划数组dp,其中dp[j]表示从雨花石中选取一些,使得它们的重量之 和为j时,所需的最少雨花石数量。输入第一行代表共10颗雨花石,第二行代表4颗雨花石重量分别为1、1、1、1、1、9、8、3、7、10。均分时可以1,1,1,1,1,9,7和10,8,3,也可以1,1,1,1,9.8和10,7,3,1,或者其他均分方式,但第一种只需要拿出重量为10.8,3的3块雨花石,第二种需要拿出4块,所以输出3(块 数最少)。均分时只能分别为1,2,需要拿出重量为1和2的两块雨花石,所以输出2。

2024-04-15 20:30:29 398

原创 题九:5G网络建设

在这个问题中,基站可以看作是图的顶点,光纤可以看作是图的边,光纤的成本可以看作是边的权重。需要在某城市进行5G 网络建设,已经选取N个地点设置5G基站,编号固定为1到N,接下来需要各个基站之间使用光纤进行连接以确保基站能互联互通,不同基站之间假设光纤的成本各不相同,且有些节点之间已经存在光纤相连。注意:基站的联通具有传递性,比如基站A与基站B架设了光纤,基站B与基站C也架设了光纤,则基站A与基站C视为可以互相联通。说明:2,3基站已有光纤相连,只要在1,3基站之间铺设光纤,其成本为1。

2024-04-15 19:21:10 196

原创 题八:数据单元的变量替换

将一个csv格式的数据文件中包含有单元格引用的内容替换为对应单元格内容的实际值。2. 每个单元格的内容包含字母和数字,以及使用分隔的单元格引用,例如:表示引用第一个单元的值。说明:第二个单元中有对A单元的引用,A单元格的值为1,替换时,将A单元的内容替代的位置,并和其他内容合并。6. 不存在多重的情况,一个单元格只能引用一个其他单元格。4. 引用单元格的位置不受限制,运行排在后面的单元格被排在前面的单元格引用。说明:第一个单元中有错误的单元格引用方式,输出-1。输入:1

2024-04-15 17:12:38 188

原创 题七:欢乐周末

小华和小为是很好好的朋友,他们约定周末一起吃饭。通过手机交流,他们在地图上选择多个聚餐地点(由于自然地形等原因,部分聚餐地点不可达),求小华和小为都能到达聚餐地点有多少个?2为小华或者小为,地图中必定有且仅有2个(非障碍物)第一行输入m和n,m代表地图的长度,n代表地图宽度。3为被选中的聚餐地点(非障碍物)可以被两方都到达的聚餐地点和数量。1为障碍物(且仅1为障碍物)地图的长宽为m和n,其中。聚餐的地点数量为k,则。

2024-04-11 18:54:24 256

原创 数仓概念理解

在数据仓库中,每个主题域都包含了一个或多个维度表和一个或多个事实表,用于存储与该主题相关的数据。在数据仓库中,每个数据域都有一个或多个源系统,数据仓库会从这些源系统中提取数据,经过清洗、转换和集成等处理后,将数据存储在数据仓库中,数据域是数据仓库中的一个高层次概念,用于组织和管理数据仓库中的数据。因此,数据域和主题域之间存在一定的层次关系。数据仓库中的每个数据域都包含了一个或多个主题域,每个主题域都包含了与其相关的维度表和事实表,以及其他的数据对象和元数据,用于支持数据分析和觉此。

2024-01-31 16:48:09 385

原创 数据漂移问题

数据一致性校验与数据漂移是两个不同的问题,数据一致性是对比源端和目标端在数据量上的一致性,数据漂移则是根据ODS表分区字段取什么值的问题,后者在一定程度上会影响到前者。

2024-01-12 17:57:28 893

原创 Hive面试知识点

order by全局排序,只有一个reducetask,数据量比较大的话排序会比较慢。sort by只对每个reduce内部的数据进行排序于分桶的功能,或者说MR当中的分区,主要是按照指定的字段,将数据划分到不同的 reduce里面去。Cluster by相当于sort by+distribute by.如果order by排序的字段和distribute by 排序的字段都是id,那么,可以写成也是在每个reduce内部进行排序。

2023-12-14 15:20:44 87

原创 Flink 实现TopN计算

【代码】Flink 实现TopN计算。

2023-12-12 11:05:08 419 1

原创 hiveSQL面试题五:同时在线问题

如下为某直播平台主播开播及关播时间,根据该数据计算出平台最高峰同时在线的主播人数 采用流式数据的思想,将一条数据拆分成两条(id,dt,flag),并且对数据进行标记:开播为1,关播为-1,1表示有主播开播在线,-1表示有主播关播离线,其中dt为开播时间或者关播时间:

2023-12-04 16:41:04 86

原创 hiveSQL面试题四:打折日期交叉问题

如下为平台商品促销数据:字段为品牌,打折开始日期,打折结束日期计算每个品牌总的打折销售天数,注意其中的交叉日期,比如 vivo 品牌,第一次活动时间为 2021-06-05 到 2021-06-15,第二次活动时间为 2021-06-09 到 2021-06-21 其中 9 号到 15 号为重复天数,只统计一次,即 vivo 总打折天数为 2021-06-05 到 2021-06-21 共计 17 天。

2023-12-04 16:11:44 94

原创 Hive窗口函数总结

Hive窗口函数是一种特殊类型的函数,它们在一组相关的行(称为窗口)上执行计算,并返回一个值。窗口函数可以在每行上应用一个聚合函数,但返回的结果是基于窗口中的行,而不是整个查询结果集。

2023-11-30 10:31:22 32

原创 hiveSQL面试题三:间隔连续问题

计算每个用户最大的连续登录天数,可以间隔一天,例如:如果用户在1,3,5,6登录游戏,则视为连续登录6天。某游戏公司记录的用户每日登录数据。

2023-11-29 17:22:18 306

原创 hiveSQL面试题二:分组问题

如下电商公司用户访问数据 table1id ts(秒)某个用户连续的访问记录如果时间间隔小于60秒则分为同一组,结果为:id ts(秒) group。

2023-11-29 15:39:26 51

原创 hiveSQL面试题一:连续问题

如下数据为蚂蚁森林中用户领取的减少碳排放量....找出连续3天及以上减少碳排放量在100以上的用户。

2023-11-29 14:48:09 50

原创 题六:数组比较

给定两个只包含数字的数组a, b, 调整数组a里面数字的顺序,使得尽可能多的a[i] > b[i]。数组a和b中的数字各不相同。输出所有可以达到最优结果的a数组数量。

2023-11-28 17:23:32 594

原创 题四:最长子串

给定一个字符串,只包含字母和数字,按要求找出字符串中的最长(连续)子串的长度,字符串本身是其最长的子串,子串要求:1、 只包含1个字母(a~z, A~Z),其余必须是数字;2、 字母可以在子串中的任意位置;如果找不到满足要求的子串,如全是字母或全是数字,则返回-1。

2023-11-27 20:11:06 244

原创 题三:找好朋友

在学校中,N个小朋友站成一队, 第i个小朋友的身高为height[i],第i个小朋友可以看到的第一个比自己身高更高的小朋友j,那么j是i的好朋友(要求j > i)。请重新生成一个列表,对应位置的输出是每个小朋友的好朋友位置,如果没有看到好朋友,请在该位置用0代替。小朋友人数范围是 [0, 40000]。

2023-11-27 19:38:13 144

原创 题二:数组排序

给定一个数组,编写一个函数来计算它的最大N个数与最小N个数的和。你需要对数组进行去重。说明:*数组中数字范围[0, 1000]*最大N个数与最小N个数不能有重叠,如有重叠,输入非法返回-1。

2023-11-27 19:33:37 50

原创 题一:亲子游戏

广度优先搜索算法(BFS)

2023-11-27 19:09:28 1868 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除