LeetCode-571. 给定数字的频率查询中位数

Numbers 表保存数字的值及其频率。

+----------+-------------+
|  Number  |  Frequency  |
+----------+-------------|
|  0       |  7          |
|  1       |  1          |
|  2       |  3          |
|  3       |  1          |
+----------+-------------+
在此表中,数字为 0, 0, 0, 0, 0, 0, 0, 1, 2, 2, 2, 3,所以中位数是 (0 + 0) / 2 = 0。

+--------+
| median |
+--------|
| 0.0000 |
+--------+
请编写一个查询来查找所有数字的中位数并将结果命名为 median 。

题目来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/find-median-given-frequency-of-numbers

审题:查询所有数字的中位数,数字的个数不同。可能奇数也可能偶数。

思考:对所有数字排序,求Frequency  列个数的和,然后计算中位数位置。然后用中位数地址位置减去Frequency里的数字,等于零的时候在那个数字位置,就是中位数。

解题:

解法一

  1. 确定每个数字,在展开后的升序列中,起始和结束下标;
  2. 在展开后的升序列中, 中位数的起始和结束下标;
  3. 由1和2,筛选出是中位数的行

注意,起始下标从0开始,结束下标为开区间。

应用排名算法:表left join自连接,group by对数字分组,按数字升序。

再筛选出比每个数字的所有其它数字的行。将这些行的中频率值相加。其值即为起始下标。

结果命名为A。

(
	SELECT N1.NUMBER, SUM(IF(N2.frequency IS NULL,0,N2.frequency)) AS `beg`
	FROM numbers AS N1
	LEFT JOIN numbers AS N2 ON (N1.NUMBER > N2.NUMBER)
	GROUP BY N1.number       ##按照number分组
	ORDER BY N1.NUMBER       ##按照升序排序
) AS A

再算每个数字,在展开后的升序列中,结束下标。

再用排名算法: 表left join自连接,group by对数字分组,按数字升序。

再筛选出比每个数字小于等于的所有其它数字的行。将这些行的中频率值相加。其值即为结束下标,且是开区间。

结果命名为B。

(
	SELECT N1.NUMBER, SUM(IF(N2.frequency IS NULL,0,N2.frequency)) AS `end`
	FROM numbers AS N1
	LEFT JOIN numbers AS N2 ON (N1.NUMBER >= N2.NUMBER)
	GROUP BY N1.number
	ORDER BY N1.number
) AS B

那么,连接表A和表B,关联于相同的数字。每个数字,在展开后升序列中的位置区间为[beg,end)。 

 

SELECT *
FROM 
(
	SELECT N1.NUMBER, SUM(IF(N2.frequency IS NULL,0,N2.frequency)) AS `beg`
	FROM numbers AS N1
	LEFT JOIN numbers AS N2 ON (N1.NUMBER > N2.NUMBER)
	GROUP BY N1.number
	ORDER BY N1.NUMBER
) AS A
JOIN 
(
	SELECT N1.NUMBER, SUM(IF(N2.frequency IS NULL,0,N2.frequency)) AS `end`
	FROM numbers AS N1
	LEFT JOIN numbers AS N2 ON (N1.NUMBER >= N2.NUMBER)
	GROUP BY N1.number
	ORDER BY N1.number
) AS B
	ON (A.NUMBER = B.NUMBER)

再算在展开后的升序列中, 中位数的起始和结束下标

数字总数N是偶数时,下标(N-1)/2和N/2位置处为中位数。N是奇数时,下标(N-1)/2为中位数。

数字的频率之和为N。确定中位数区间[beg,beg+cnt+1),beg从0开始

beg = (N-1)/2

cnt = 0或1,N为偶数时为1,N为奇数时为0。

结果命名为表C。

(
	SELECT FLOOR((SUM(N.frequency)-1)/2) AS `beg`,
        if(SUM(N.frequency)%2=1,0,1) AS `cnt`
	FROM numbers AS N
) AS C

第三步,筛出落在中位数区间中的数字

已经有每个数字的位置区间S=[A.beg,B.end)。中位数位置区间T=[beg,beg+cnt+1) 。

易知,区间S和区间T相交位置的数字是中位数。

区间S与区间T的长度大小关系有两种。

第一种,T区间长度 >= S区间长度。

那么,判断区间S与区间T是否相交,逻辑为:

if(S的起点落在区间T中 或 S的尾部落在区间T中)
{
    满足此条件的数据行为中位数行
}

 

(
	(C.beg <= A.beg AND A.beg < (C.beg +C.cnt+1)) 
	OR 
	(C.beg < B.END AND B.END <= (C.beg +C.cnt+1))
)

第二种,T区间长度 < S区间长度。

那么,判断区间S与区间T是否相交,逻辑为:

if(T的起点落在区间S中 或 T的尾部落在区间S中)
{
    满足此条件的数据行为中位数行
}
(
	(A.beg <= C.beg AND C.beg < B.end) 
	OR 
	(A.beg < (C.beg+C.cnt+1) AND (C.beg+C.cnt+1) <= B.END)
)

 合起来,判断中位数的逻辑是:

(
	(
		(C.beg <= A.beg AND A.beg < (C.beg +C.cnt+1)) 
		OR 
		(C.beg < B.END AND B.END <= (C.beg +C.cnt+1))
	)
	OR
	(
		(A.beg <= C.beg AND C.beg < B.end) 
		OR 
		(A.beg < (C.beg+C.cnt+1) AND (C.beg+C.cnt+1) <= B.END)
	)
)

 连接表A,表B和表C,得出中位数的数字:

SELECT *
FROM 
(
	SELECT N1.NUMBER, SUM(IF(N2.frequency IS NULL,0,N2.frequency)) AS `beg`
	FROM numbers AS N1
	LEFT JOIN numbers AS N2 ON (N1.NUMBER > N2.NUMBER)
	GROUP BY N1.number
	ORDER BY N1.NUMBER
) AS A
JOIN 
(
	SELECT N1.NUMBER, SUM(IF(N2.frequency IS NULL,0,N2.frequency)) AS `end`
	FROM numbers AS N1
	LEFT JOIN numbers AS N2 ON (N1.NUMBER >= N2.NUMBER)
	GROUP BY N1.number
	ORDER BY N1.number
) AS B
	ON (A.NUMBER = B.NUMBER)
JOIN 
(
	SELECT FLOOR((SUM(N.frequency)-1)/2) AS `beg`, if(SUM(N.frequency)%2=1,0,1) AS `cnt`
	FROM numbers AS N
) AS C
	ON (
			(
				(C.beg <= A.beg AND A.beg < (C.beg +C.cnt+1)) 
				OR 
				(C.beg < B.END AND B.END <= (C.beg +C.cnt+1))
			)
			OR
			(
				(A.beg <= C.beg AND C.beg < B.end) 
				OR 
				(A.beg < (C.beg+C.cnt+1) AND (C.beg+C.cnt+1) <= B.END)
			)
		)

在结果集中,

当数字总数N为偶数是,最多有两行数据。

当数字总数N为奇数是,只有一行数据。

因此可知,中位数 = 数据行的数字总和 / 数据总行数 = 数字的平均数

SELECT AVG(A.NUMBER) AS `median`
FROM
...

 最终结果:

SELECT AVG(A.NUMBER) AS `median`
FROM 
(
	SELECT N1.NUMBER, SUM(IF(N2.frequency IS NULL,0,N2.frequency)) AS `beg`
	FROM numbers AS N1
	LEFT JOIN numbers AS N2 ON (N1.NUMBER > N2.NUMBER)
	GROUP BY N1.number
	ORDER BY N1.NUMBER
) AS A
JOIN 
(
	SELECT N1.NUMBER, SUM(IF(N2.frequency IS NULL,0,N2.frequency)) AS `end`
	FROM numbers AS N1
	LEFT JOIN numbers AS N2 ON (N1.NUMBER >= N2.NUMBER)
	GROUP BY N1.number
	ORDER BY N1.number
) AS B
	ON (A.NUMBER = B.NUMBER)
JOIN 
(
	SELECT FLOOR((SUM(N.frequency)-1)/2) AS `beg`, if(SUM(N.frequency)%2=1,0,1) AS `cnt`
	FROM numbers AS N
) AS C
	ON (
			(
				(C.beg <= A.beg AND A.beg < (C.beg +C.cnt+1)) 
				OR 
				(C.beg < B.END AND B.END <= (C.beg +C.cnt+1))
			)
			OR
			(
				(A.beg <= C.beg AND C.beg < B.end) 
				OR 
				(A.beg < (C.beg+C.cnt+1) AND (C.beg+C.cnt+1) <= B.END)
			)
		)
GROUP BY C.cnt

解法二

先算在展开后的升序列中, 中位数的起始和结束下标

借鉴解法一,逻辑为:

(
	SELECT FLOOR((SUM(N.frequency)-1)/2) AS `beg`,
        if(SUM(N.frequency)%2=1,0,1) AS `cnt`
	FROM numbers AS N
) AS B

定义用户变量:@fre_sum——数字升序列中频率前缀和,从0开始。

(SELECT @fre_sum:=0) AS C

连接数字表A,表B和表C,并按照数字升序。

(
        SELECT *
	FROM 
	numbers AS A,
	(
		SELECT 
			FLOOR((SUM(N.frequency)-1)/2) AS `beg`, 
			IF(SUM(N.frequency)%2=1,0,1) AS `cnt`
		FROM numbers AS N
	) AS B,
	(SELECT @fre_sum:=0) AS C
	ORDER BY A.number
) AS D

再选出中位数的数字。

每个数字的@fre_sum的值,确定了一个区间S=[@fre_sum,@fre_sum+A.frequency)。

只要中位数区间T=[B.beg,B.beg+B.cnt+1)与区间T相交。相交的数字即是中位数。

判断相交的逻辑:

if(T的起点落在区间S中 或 T的终点落在区间S中){
    此数字是中位数
}
	if(
		@fre_sum<=B.beg AND B.beg < (@fre_sum + A.Frequency),
		1,
		if(
			@fre_sum < (B.beg+B.cnt+1) AND (B.beg+B.cnt+1) <= (@fre_sum + A.Frequency),
			1,
			0
		)
	) AS wanted

 

@fre_sum:=@fre_sum+A.Frequency AS fre

 

(
	SELECT A.*,B.*,
	if(
		@fre_sum<=B.beg AND B.beg < (@fre_sum + A.Frequency),
		1,
		if(
			@fre_sum < (B.beg+B.cnt+1) AND (B.beg+B.cnt+1) <= (@fre_sum + A.Frequency),
			1,
			0
		)
	) AS wanted,
	@fre_sum:=@fre_sum+A.Frequency AS fre
	FROM 
	numbers AS A,
	(
		SELECT 
			FLOOR((SUM(N.frequency)-1)/2) AS `beg`, 
			IF(SUM(N.frequency)%2=1,0,1) AS `cnt`
		FROM numbers AS N
	) AS B,
	(SELECT @fre_sum:=0) AS C
	ORDER BY A.number
) AS D

从表D中选出wanted=1的数字,并求平均值,为最终结果。

 

SELECT AVG(D.NUMBER) AS `median`
FROM 
(
	SELECT A.*,B.*,
	if(
		@fre_sum<=B.beg AND B.beg < (@fre_sum + A.Frequency),
		1,
		if(
			@fre_sum < (B.beg+B.cnt+1) AND (B.beg+B.cnt+1) <= (@fre_sum + A.Frequency),
			1,
			0
		)
	) AS wanted,
	@fre_sum:=@fre_sum+A.Frequency AS fre
	FROM 
	numbers AS A,
	(
		SELECT 
			FLOOR((SUM(N.frequency)-1)/2) AS `beg`, 
			IF(SUM(N.frequency)%2=1,0,1) AS `cnt`
		FROM numbers AS N
	) AS B,
	(SELECT @fre_sum:=0) AS C
	ORDER BY A.number
) AS D
WHERE wanted = 1

知识点:

1.round()函数遵循四舍五入原则,用于把数值字段舍入为指定的小数位数

2.floor(value)函数返回小于或等于指定值(value)的最小整数

3.ceiling(value)函数返回大于或等于指定值(value)的最小整数

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 好的,我来用中文回复这个链接:https://leetcode-cn.com/tag/dynamic-programming/ 这个链接是 LeetCode 上关于动态规划的题目集合。动态规划是一种常用的算法思想,可以用来解决很多实际问题,比如最长公共子序列、背包问题、最短路径等等。在 LeetCode 上,动态规划也是一个非常重要的题型,很多题目都需要用到动态规划的思想来解决。 这个链接里包含了很多关于动态规划的题目,按照难度从简单到困难排列。每个题目都有详细的题目描述、输入输出样例、题目解析和代码实现等内容,非常适合想要学习动态规划算法的人来练习和提高自己的能力。 总之,这个链接是一个非常好的学习动态规划算法的资源,建议大家多多利用。 ### 回答2: 动态规划是一种算法思想,通常用于优化具有重叠子问题和最优子结构性质的问题。由于其成熟的数学理论和强大的实用效果,动态规划在计算机科学、数学、经济学、管理学等领域均有重要应用。 在计算机科学领域,动态规划常用于解决最优化问题,如背包问题、图像处理、语音识别、自然语言处理等。同时,在计算机网络和分布式系统中,动态规划也广泛应用于各种优化算法中,如链路优化、路由算法、网络流量控制等。 对于算法领域的程序员而言,动态规划是一种必要的技能和知识点。在LeetCode这样的程序员平台上,题目分类和标签设置十分细致和方便,方便程序员查找并深入学习不同类型的算法。 LeetCode的动态规划标签下的题目涵盖了各种难度级别和场景的问题。从简单的斐波那契数列、迷宫问题到可以用于实际应用的背包问题、最长公共子序列等,难度不断递进且话题丰富,有助于开发人员掌握动态规划的实际应用技能和抽象思维模式。 因此,深入LeetCode动态规划分类下的题目学习和练习,对于程序员的职业发展和技能提升有着重要的意义。 ### 回答3: 动态规划是一种常见的算法思想,它通过将问题拆分成子问题的方式进行求解。在LeetCode中,动态规划标签涵盖了众多经典和优美的算法问题,例如斐波那契数列、矩阵链乘法、背包问题等。 动态规划的核心思想是“记忆化搜索”,即将中间状态保存下来,避免重复计算。通常情况下,我们会使用一张二维表来记录状态转移过程中的中间值,例如动态规划求解斐波那契数列问题时,就可以定义一个二维数组f[i][j],代表第i项斐波那契数列中,第j个元素的值。 在LeetCode中,动态规划标签下有众多难度不同的问题。例如,经典的“爬楼梯”问题,要求我们计算到n级楼梯的方案数。这个问题的解法非常简单,只需要维护一个长度为n的数组,记录到达每一级楼梯的方案数即可。类似的问题还有“零钱兑换”、“乘积最大子数组”、“通配符匹配”等,它们都采用了类似的动态规划思想,通过拆分问题、保存中间状态来求解问题。 需要注意的是,动态规划算法并不是万能的,它虽然可以处理众多经典问题,但在某些场景下并不适用。例如,某些问题的状态转移过程比较复杂,或者状态转移方程中存在多个参数,这些情况下使用动态规划算法可能会变得比较麻烦。此外,动态规划算法也存在一些常见误区,例如错用贪心思想、未考虑边界情况等。 总之,掌握动态规划算法对于LeetCode的学习和解题都非常重要。除了刷题以外,我们还可以通过阅读经典的动态规划书籍,例如《算法竞赛进阶指南》、《算法与数据结构基础》等,来深入理解这种算法思想。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值