【分治算法】【Python实现】线性时间选择

「已注销」

已于 2024-05-20 15:10:46 修改

阅读量1.4k

点赞数 36

分类专栏： # 分治算法文章标签：分治算法 Python

于 2024-05-04 19:14:52 首次发布

本文链接：https://blog.csdn.net/from__2024_04_11/article/details/138448165

版权

分治算法专栏收录该内容

12 篇文章 3 订阅

订阅专栏

本文介绍了随机选择算法的Python实现，包括partition和quick_select函数，以及其在最坏情况下的时间复杂性。随后对比了随机选择算法与BFPRT算法，后者在平均情况下具有线性时间复杂度。文中还提供了BFPRT算法的原理和Python实现，利用中位数的中位数找到划分基准，从而在大多数情况下达到O(n)的时间效率。

摘要由CSDN通过智能技术生成

文章目录

@[toc]
问题描述
随机选择算法
Python实现
时间复杂性

BFPRT算法
时间复杂性
Python实现

因上努力

个人主页：丷从心·

系列专栏：分治算法

学习指南：算法学习指南

果上随缘

问题描述

给定线性序集中 $n$ 个元素和一个整数 $\leq k \leq n)$ ，找出这 $n$ 个元素中第 $k$ 小的元素

随机选择算法

Python实现

import random


def partition(nums, left, right):
    pivot_index = random.randint(left, right)
    pivot = nums[pivot_index]

    # 将 pivot 元素移动到列表的最右边
    nums[pivot_index], nums[right] = nums[right], nums[pivot_index]

    # 通过交换操作, 将小于 pivot 的元素移动到左边, 大于 pivot 的元素移动到右边
    i = left
    for j in range(left, right):
        if nums[j] < pivot:
            nums[i], nums[j] = nums[j], nums[i]

            i += 1

    # 将 pivot 元素放置到正确的位置
    nums[i], nums[right] = nums[right], nums[i]

    return i


def quick_select(nums, left, right, k):
    if left == right:
        return nums[left]

    # 划分数组, 并获取 pivot 元素的索引
    pivot_index = partition(nums, left, right)

    j = pivot_index - left + 1

    if k == j:
        # 如果 pivot 元素的索引等于 k, 则返回该元素
        return nums[pivot_index]
    elif k < j:
        # 如果 pivot 元素的索引大于 k, 则在左侧继续查找
        return quick_select(nums, left, pivot_index - 1, k)
    else:
        # 如果 pivot 元素的索引小于 k, 则在右侧继续查找
        return quick_select(nums, pivot_index + 1, right, k - j)


def find_kth_smallest(nums, k):
    if k < 1 or k > len(nums):
        raise ValueError('Invalid value of k')

    return quick_select(nums, 0, len(nums) - 1, k)


nums = [3, 1, 5, 2, 4]
k = 2

res = find_kth_smallest(nums, k)

print(f'第 {k} 小的元素为 {res}')

第 2 小的元素为 2

时间复杂性

随机选择算法在最坏情况下需要 $\Omega(n^{2})$ 时间，平均情况下需要 $O (n)$ 时间

BFPRT算法

如果能在线性时间内找到一个划分基准，使得按这个基准划分出的两个子数组的长度都最多为原数组长度的 $\varepsilon$ 倍（ $\varepsilon < 1$ 是某个常数），那么在最坏情况下用 $O (n)$ 时间就可以完成选择任务
- 例如，若 $\varepsilon = 9 / 10$ ，算法递归调用所产生的子数组的长度至少缩短 $1/10$ ，所以在最坏情况下，算法所需的计算时间 $T (n)$ 满足递归式 $\leq T(9n / 10) + O(n)$ ，由此可得 $T (n) = O (n)$
将 $n$ 个输入元素划分成 $\left\lceil n / 5 \right\rceil$ 个组，每组 $5$ 个元素（除可能有一个组不是 $5$ 个元素外），用任意一种排序算法，将每组中的元素排好序，并取出每组的中位数，共 $\left\lceil n / 5 \right\rceil$ 个
递归调用找出这 $\left\lceil n / 5 \right\rceil$ 个元素的中位数，如果 $\left\lceil n / 5 \right\rceil$ 是偶数，就找它的两个中位数中较大的一个，然后以这个元素作为划分基准
设所有元素互不相同，找出的基准 $x$ 至少比 $\left\lfloor (n - 5) / 10 \right\rfloor$ 个元素大，至少比 $\left\lfloor (n - 5) / 10 \right\rfloor$ 个元素小，当 $\geq 75$ 时， $\left\lfloor (n - 5) / 10 \right\rfloor \geq n / 4$ ，所以按此基准划分所得的两个子数组的长度都至少缩短 $1/4$

时间复杂性

设对 $n$ 个元素的数组调用算法需要 $T (n)$ 时间
找中位数的中位数 $x$ 最多用 $T (n /5)$ 时间
按照算法所选的基准 $x$ 进行划分所得的两个子数组分别最多有 $3 n /4$ 个元素，无论对哪一个子数组调用算法都最多用 $T (3 n /4)$ 时间

$\leq \begin{cases} C_{1} , & n < 75 \\ C_{2} n + T(n / 5) + T(3n / 4) , & n \geq 75 \end{cases}$

$T (n) = O (n)$

Python实现

import statistics


def find_median_of_medians(arr):
    # 将数组划分为大小为 5 的子数组
    sublists = [arr[i:i + 5] for i in range(0, len(arr), 5)]

    # 计算每个子数组的中位数
    medians = [statistics.median(sublist) for sublist in sublists]

    # 如果元素数量小于等于 5, 直接返回中位数
    if len(medians) <= 5:
        return statistics.median(medians)

    # 递归调用中位数的中位数算法
    return find_median_of_medians(medians)


def linear_time_select(arr, k):
    # 找到中位数的中位数
    median_of_medians = find_median_of_medians(arr)

    # 将数组划分为三个部分
    less = [x for x in arr if x < median_of_medians]
    equal = [x for x in arr if x == median_of_medians]
    greater = [x for x in arr if x > median_of_medians]

    # 根据划分后的数组长度选择下一步操作
    if k <= len(less):
        # 在较小的部分递归查找第 k 小元素
        return linear_time_select(less, k)
    elif k <= len(less) + len(equal):
        # 第 k 小元素等于中位数的中位数
        return median_of_medians
    else:
        # 在较大的部分递归查找第 k 小元素
        return linear_time_select(greater, k - len(less) - len(equal))


nums = [3, 1, 5, 2, 4]
k = 2

res = linear_time_select(nums, k)

print(f'第 {k} 小的元素为 {res}')