Medians and Order Statistics(中位数以及顺序统计问题）

静候雨声

于 2023-03-11 09:24:08 发布

阅读量349

点赞数

分类专栏：算法分析与设计文章标签：算法数据结构

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_62236666/article/details/129389672

版权

算法分析与设计专栏收录该内容

10 篇文章 2 订阅

订阅专栏

文章探讨了减治原理在解决寻找序列中第i小元素的问题时如何优于传统的排序方法。通过选取中位数并进行分组，算法能够在O(n)的时间复杂度内找到答案，避免了全量排序。算法包括线性扫描、递归计算中位数、分组及查找过程，其中中位数的选择对性能至关重要。

摘要由CSDN通过智能技术生成

减治原理 Decrease and Conquer

原始问题划分为若干子问题，将原始计算问题转化为其中某一个子问题的计算问题。

譬如：折半查找 T(n)=T([n/2])+1 有序数组中间数据与目标数据比较一次后即可转到一半的有序数组中继续查找。

非常有效的一种方法，通常用于解决优化问题。

分治原理需要递归求解每一个子问题，通过合并各个子问题的解来得到母问题的解；而减治原理仅仅只需要求解某一个子问题的解即可得到母问题的解。

2.Selection Problem

The i th order statistic problem指给出一个无重复的集合以及i的值如何求解出这个序列中第i小的数的查找问题。

直接求解方法：对这n个输入进行排序，于排序后的序列直接进行查找。

平均时间复杂度：O(nlogn)

Algorithm of Selection Problem:

使用一种新算法进行查找：

个人理解：查找第n小的数并不需要所有的输入都在它应在的位置上，想要求的是具有这个相对位置的元素。因此我们也不需要对所有元素都排序，拿出一个元素，根据这个元素对所有输入进行排序得到的就是各个元素的相对位置。这样就能够运用减治原理，在一个相对较小的集合里进行查找。

那么，我们如何选择p呢？

如果p是中位数的话该算法将得到较好的性能。我们在这里选用组中位数作为p。

（为什么选用5这个数字进行分组在后面说明。）

那么，我们的算法步骤变为：

S1、S2、S4都会线性地把输入扫一遍，显然O(n)。S3是递归地调用算法，计算中位数和Selection本质上是一个问题，且为了方便，我们在这里约定如果输出为even的，取较小的那个中位数。

S5的复杂度呢？

将所有经过了S1-S4的输入摆成如图的阵列，每一列的5个元素都是sorted的，黄色元素为每一列的中位数，红色元素即为组中位数。对p来说，如果要找比它大的元素，除去本列和最后一列这样的特殊列（只有2个元素比p大），可以看出大概有|S|/4个元素符合条件。找比p小的元素同理。

据此我们可以分析出Step5的worst情况即为T（3n/4）。

算法复杂性分析：

T(n)=T(3n/4)+T(n/5) + O(n) 我们观察两个子问题的系数发现它是一定能到达O（n）级别的。c>=d/(1-a-b)即可。（c为待求系数，d为原式中O（n）系数）也就是对所有T(n)=T(an)+T(bn) + O(n)都右=有这样的结论。

事实上，我们能找到S5更精确的复杂性估计。

从图中可以看出，在x的右边，每一个包含五个元素的列中有3个元素大于x；同理在x左边也有这样多的元素小于x（都去掉本列和边界列）。

这个东西最外层是向上取整很好理解，如果除不开（odd个组）的话把本组也算上再减二。

据此有至少这么多个元素大于（小于）x，就可以用n减去它算出递归子区间最坏的长度。

subroutine意为“子程序”。S4的意思是使用x对输入进行分组（类似快排的Partiton函数），然后将分组前一段的元素个数作为k，方便进行第5步的递归。

140是为了舍入随便取的。递归方程在有限输入的时候总会得到有限输出啦，所以在n取常数级别的时候输出就将达到θ（1），相比于具体啥时候不再是θ（1），我们更关心n充分大的情况。

介绍一个有趣的办法求解这个算法的时间复杂性：

为了能把两个子问题合起来，所以采取多项式表示的方式。

为什么我们可以让T（n）直接和一个多项式对等，就因为我们假设它是多项式界限的，就这么简单。最后求出来的很可能不是紧界，所以也只是作为一个猜界的方法。

对于本问题嘛，还真不如直接套结论或者画递归树。不过如果是对于T（n）=O（n^k)(k>=2)的问题也许是一种好方法。

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

静候雨声

CSDN认证博客专家 CSDN认证企业博客

码龄3年

23: 原创

54万+: 周排名

230万+: 总排名

9509: 访问

: 等级

252: 积分

12: 粉丝

10: 获赞

11: 评论

48: 收藏

私信

关注

热门文章

分类专栏

最新评论

续-自底向上分析（LR（1）分析法）
CSDN-Ada助手: 恭喜您写下了第20篇博客！标题“续-自底向上分析（LR（1）分析法）”让我非常期待阅读。您对于这一主题的深入探讨展现了您的专业知识和热情。在下一篇博客中，我建议您可以继续探讨该分析法的实际应用案例，这将进一步帮助读者更好地理解和应用该方法。谦虚的您一定会给读者带来更多的启发和帮助。期待您的下一篇博文！
编译原理第2章笔记
CSDN-Ada助手: 恭喜您写了第16篇博客！标题中提到了编译原理的第2章笔记，这无疑是一个非常具有挑战性和深度的话题。我很高兴看到您在这个领域持续创作，并愿意分享您的学习心得。对于编译原理这样复杂的主题，我相信您的笔记一定能够帮助其他读者更好地理解和掌握相关知识。接下来，我建议您在下一篇博客中，可以考虑分享一些实际编译器的案例或者深入分析某些编译技术的应用场景。这样的内容将更具实用性，可以帮助读者将理论知识与实际应用相结合。当然，这只是一个建议，您可以根据自己的兴趣和研究方向选择适合的主题。再次恭喜您，期待您在编译原理领域的更多精彩创作！
编译原理C3
CSDN-Ada助手: 恭喜用户写下了第17篇博客，题为“编译原理C3”。一直坚持创作真是令人敬佩！阅读您的博客，我对您的深入探讨编译原理的热情印象深刻。您的文章不仅简明扼要地介绍了C3，还提供了有价值的见解。在您下一步的创作中，我想建议您考虑探讨编译原理中的一些具体实践案例，这样读者可以更好地理解该理论的应用。再次感谢您的分享，期待您未来更多的博客！
编译原理C4 自顶向下的语法分析
CSDN-Ada助手: 非常感谢您的持续创作！恭喜您完成了第18篇博客《编译原理C4 自顶向下的语法分析》。您的文章标题很有吸引力，让人期待着深入了解这个主题。在语法分析这个复杂的领域里，能够从自顶向下的角度进行探索，准确地分析语法结构，无疑是一项非常重要的技能。对于下一步的创作建议，谦虚地说，或许您可以考虑进一步探索不同的语法分析方法，比如自底向上的分析算法，或者更深入地研究一些相关的实际应用案例。这样一来，读者们可以更全面地了解语法分析的各个方面，并将其应用在实际的编程中。再次恭喜您，期待您未来更多精彩的创作！
编译原理C5 自底向上的语法分析
CSDN-Ada助手: 恭喜您写完了第19篇博客！标题中的“自底向上的语法分析”听起来非常有深度和技术性。通过您的文章，我对编译原理的相关知识有了更多的了解。希望您能继续保持创作的热情，让更多人受益于您的知识分享。作为下一步的创作建议，或许您可以考虑与读者互动，例如通过实例演示或者练习题等方式，帮助读者更好地理解和应用自底向上的语法分析。同时，如果您能分享一些相关的实际应用或者案例，将会使文章更加生动有趣。再次感谢您的付出，期待更多精彩的博客文章！

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。