什么是近似算法?它适用于哪些问题?这篇文章给你答案

点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

罗素曾说:所有精确科学都被近似思想所主宰。本文介绍了近似算法及其对某些标准问题的适用性。

新冠大流行给世界带来了巨大的改变,全球科学家和研究人员在研制有效的疫苗。他们正在做的就是从广阔的样本空间中近似地收紧可能性范围,并尽力得到一些有效解。近似在我们的生活中发挥了重要作用。

以在线食品配送为例,我们经常从网上订购食物,享受快速送达的服务。但你想过这些 app 后端运行的什么算法让快递员在更短时间内抵达目的地吗?答案是近似算法。这类问题就是「旅行商问题」。

5b1fac8cecb5219652001dfbcc205b35.gif

食品配送:旅行商问题的现实应用。

本文将介绍近似算法及其对某些标准问题的适用性,以及哪些因素会影响到特定算法的选择。

什么是近似算法?

近似算法是一种处理优化问题 NP 完全性的方式,它无法确保最优解。近似算法的目标是在多项式时间内尽可能地接近最优值。

它虽然无法给出精确最优解,但可以将问题收敛到最终解的近似值。其目标满足以下三个关键特性:

  • 能够在多项式时间内高效运行;

  • 能够给出最优解;

  • 对于每个问题实例均有效。

背景

数学表达式的评估常伴随常量、变量分析和方程的阶,可用于衡量近似的复杂度。此类评估将问题分解为 P 和 NP 难问题

P 问题和 NP 问题的策略

P 问题是指可以在多项式时间内求解的问题。

NP 表示不确定性多项式时间(nondeterministic polynomial time),NP 问题是指在多项式时间内近似验证答案的问题。但目前人们发现,很多此类问题需要指数时间才能求解。

3e97e5dbb445002de0f3ada8b5fb941a.png

P 和 NP 策略。

真正的争论在于 P=NP 还是 P≠NP。之前的一些研究证明这两种都是对的。如果一个问题是多项式次方,则存在多个最优算法。因此,在 NP 完全问题中,存在两种方法找到近优解,然后选择最适合的算法。

如果输入的大小比较小,则具备指数运行时间的算法可能会比较适合。

其次,通过用近似算法替代确定性算法,我们仍然能够在多项式时间内找到近优解。

近似算法的复杂度可以从输入大小和近似因子中推断出来。接下来,我们通过一些示例,深入探索这些算法如何应用到现实问题中。

分区问题

在计算机科学领域,该问题的定义是:给定多重正整数集 X,它可以被分割为两个元素之和相等的子集 X1 和 X2,即每个子集的数值之和与另一个子集相等。

5ca88618584aa157b7ba444493b110f8.png

例如,X={3,4,1,3,3,2,3,2,1} 可以被分割为 X1={3,3,2,3} 和 X2={4,2,3,1,1},二者的数值之和都是 11。

类似地,X={1,3,1,2,1,2} 可以被分成 X1={2,1,1,1} 和 X2={3,2},两个子集的数值之和都是 5。有趣的是,这不是唯一解。X1={1,3,1} 和 X2={2,1,2} 的数值之和也为 5,这表明存在多个可能的子集。

这就是 NP 完全问题,存在伪多项式时间动态规划解,可获得该问题的近优解。

方法和决定步骤

现在,我们开始分析这个问题,把它分解成数个单独的标准问题。这里,我们想要找出多重集的元素之和相等的子集,那么该问题就可以分解成以下两个问题:

  • 子集和问题:子集 X 的元素之和等于数字 W。

  • 多路数字分割:给定整数参数 W,确定如何将 X 分割成 W 个等额子集。

近似算法

如上所述,将分区问题分解为多路分割与子集和问题后,我们就可以考虑为这些问题而开发的算法,包括:

贪婪数字分割(Greedy number Partitioning)

该算法循环遍历所有数字,将每个数字分配给总和最小的子集。如果数字未以排序方式排列,则其运行时复杂度为 O(n),近似率约为 3/2。其 Python 伪代码如下:

def find_partition(numbers):
    """Separate the available numbers into two eqal sum series.




    Args:
        numbers: collection of numbers, for example list of integers.




    Returns:
        Two lists of numbers.
    """
    X = []
    Y = []
    sum_X = 0
    sum_Y = 0
    for n in sorted(numbers, reverse=True):
        if sum_X < sum_Y:
           X.append(n)
           sum_X = sum_X + n
        else:
           Y.append(n)
           sum_Y = sum_Y + n
    return (X, Y)

将数字排序,则运行时复杂度增加到 O(n logn),近似率增加到 7/6。如果数字在 [0,1] 范围内均匀分布,则近似率约为 1 + O(log logn/n)。

e096968721cb6f374e05f36677bcf3e6.png

分区问题图示。

上图用二叉树的形式展示所有分区。树的根部表示集合中的最大数,每一级对应输入数字,每个独立分支对应不同的子集。遍历这些集合需要深度优先遍历(depth-first traversal),所需的空间复杂度为 O(n),时间复杂度为 O(2^n)。

适用性:

该算法可以根据情况进行修改,以便改善运行时复杂度。每一级的首要目标是构建一个分支,将当前数字分配给总和最小的子集。首先通过贪婪数字分割找出总和,然后切换到优化,得到全多项式时间近似解。

Karmarkar-Karp 算法

Karmarkar-Karp 算法指以降序方式排列数字的最大差分方法,该方法将差值替换掉原来的数字不断放进集合中。其 Java 伪代码实现如下:

int karmarkarKarpPartition(int[] baseArr) {    
    // create max heap    
    PriorityQueue<Integer> heap = new PriorityQueue<Integer>(baseArr.length, REVERSE_INT_CMP);




    for (int value : baseArr) {        
        heap.add(value);    
    }




    while (heap.size() > 1) {
        int val1 = heap.poll();    
        int val2 = heap.poll();    
        heap.add(val1 - val2);
    }




    return heap.poll();
}

该算法包含输入集 S 和参数 k。将 S 分割成 k 个子集,使这些子集中的数字总和相等,从而构建期望输出。该算法包含如下关键步骤:

  • 以降序方式排列数字;

  • 用差值替换掉原来的数字,直到只有一个数字;

  • 采用回溯算法,完成分区。

适用性:

该算法通过构建二叉树来假设分区。每一级表示一对数字,左侧的分支表示用差值替换数字,右侧的分支表示将差值放置在同一个子集中。该算法先通过最大差分求得解,然后继续寻找更好的近似解。它所需的空间复杂度为 O(n),但最糟糕的情况下所需的时间复杂度可能会达到 O(2^n)。

装箱问题

装箱问题有多种现实应用。例如,如何从根本上改善印度的垃圾管理系统。这个问题就可以通过装箱问题来解决,帮助当局决定 x 量的垃圾需要多少个垃圾箱。

39198a7fed8c6e82032525f9bcdcf135.png

集装箱船:装箱问题的现实应用。

在计算机科学领域中,该问题可用于多种内存管理技术。在该算法中,我们可以通过去除冗余和最小化空间浪费来包装不同形状和大小的对象。

例如:给定一个包含 n 个项的集合,每个项的大小分别为 s1,s2,..,sn (0<=si<=1, 1<=i<=n),如何将它们装进最少数量的箱子?

经典方法:

1. 邻近适应算法 (Next Fit):查看当前项是否适合当前箱子。如果适合,则将物品放置在箱子里,否则开启一个新的箱子。

我们来看一个示例:项是 0.5, 0.7, 0.5, 0.2, 0.4, 0.2, 0.5, 0.1, 0.6,箱子大小均为 1。

54164fd6eb24270ae75f4aaedb157a0a.png

基于邻近适应算法的装箱解决方案(M = 箱子总数 = 6)。

2. 最先匹配法 (First Fit):按顺序浏览箱子,在第一个箱中放置新的项,直到放不下再启用新的箱子。

我们来看一个示例:项是 0.5, 0.7, 0.5, 0.2, 0.4, 0.2, 0.5, 0.1, 0.6,箱子的大小均为 1。

4d552d97cdfd4f93eacbcce9e1db6d1b.png

基于最先匹配法的装箱解决方案(M = 箱子总数 = 5)。

3. 最优匹配法 (Best Fit):按顺序浏览箱子,将每一个新的项放在最适合的箱子里。如果不适合,则创建一个新的箱子。

我们来看一个示例:项是 0.5, 0.7, 0.5, 0.2, 0.4, 0.2, 0.5, 0.1, 0.6,箱子的大小均为 1。

38d280a83a140f0052942db6688db387.png

基于最优匹配法的装箱解决方案(M = 箱子总数 = 5)。

该方法的输出与最先匹配法相同,但该方法的优点是实现速度比 FFD 快,即时间复杂度为 O(nlogn)。

自然方法:

如果我们提前知道所有项的大小,那么自然的解决方案就是首先按照从大到小排序,然后应用以下启发式方法:

  • 最先匹配递减法

  • 最优匹配递减法

假设有相同的示例 0.7, 0.6, 0.5, 0.5, 0.5, 0.4, 0.2, 0.2, 0.1,则排序为 0.7, 0.6, 0.5, 0.5, 0.5, 0.4, 0.2, 0.2, 0.1。

ebeb59306959ae58c7473fcb34d3228d.png

优化方法(M = 箱子总数 = 4)。

参考文献:

1. https://cutt.ly/4hSDx2Y

2. https://cutt.ly/xhSDhEM

3. https://shorturl.at/hxCO5 

4.https://en.wikipedia.org/wiki/Bin_packing_problem#Approximation_algorithms_for_bin_packing 

5. https://en.wikipedia.org/wiki/Partition_problem 

6.https://www.javatpoint.com/daa-approximate-algorithms#:~:text=An%20Approximate%20Algorithm%20is%20a,at%20the%20most%20polynomial%20time

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

73b620957a09a7eff4d92dd33b127117.png

845ef5fb4acf1b3ccd5d69b5571d1fe6.png

  • 0
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 弱导波光纤是一种具有特殊结构的光纤,其核心与包层之间有一个折射率微小的区域,这个区域被称为“弱导区”或“弱导波区”。在这个区域内,光线的传播受到限制,只能以一种特定的方式传播,这种传播方式被称为“弱导波”。 弱导波光纤被广泛应用于光通信领域,因为它可以实现对光信号的强烈约束和导引。在弱导波光纤中,光信号只能在弱导区内传播,这样可以减少光信号在纵向和横向上的损失,并增强光信号的传输距离和带宽。 因此,弱导波光纤的特殊结构和性能使其适用于弱导波导引和传输,同时也使其成为一种重要的光通信材料。 ### 回答2: 弱导波光纤,也称为单模光纤,是一种具有特定结构的光导波纤维。它具有较小的直径和高折射率差,能够使光信号在纤芯中以单一的模式进行传输。相比于多模光纤,弱导波光纤的传输损耗更小,带宽更宽,传输距离更远。 标量近似解只适用于弱导波光纤,是因为弱导波光纤中的光场模式可以近似为标量场。标量场只考虑光的振幅部分,忽略了光场的相位信息。在弱导波光纤的应用中,通常我们只考虑光的振幅变化,如光的功率、衰减和传播特性等。因而,标量近似提供了简化光传输计算的有效方法。 此外,弱导波光纤的纤芯结构通常比较均匀,折射率变化较小,使得光线传输比较准直,各光线之间不会发生较大的反射和折射。因此,标量近似可以较好地描述其中的光传播行为。 然而,对于大直径或高模式阶数的光纤,如多模光纤或特殊结构光纤,标量场近似就不再适用了。这是因为在这些光纤中,光场的振幅和相位信息都非常重要,无法仅仅通过简化为标量场来描述光的传播行为。在这些情况下,需要使用矢量光学或光波方程等更加复杂的理论模型来进行分析。 ### 回答3: 弱导波光纤(Weakly guiding fiber)是一种光纤结构,它的导波性能较差。光线在弱导波光纤中的传播方式主要基于折射,而不是全内反射。弱导波光纤通常有一个小的折射率差,允许较弱的光信号沿着光纤传播。 标量近似解(Scalar approximation)适用于弱导波光纤,因为在这种光纤中,光场只有一种传播方向,可以被简化为标量场。这意味着光场的传播只需考虑振幅的变化,而不需要考虑相位的变化。 在弱导波光纤中,光的纵向传播远远快于其横向传播。因此,在描述光在这种光纤中的传播过程时,可以忽略横向分量的变化,只考虑纵向分量的变化。此时,可以使用标量波动方程描述光的传播行为。 标量近似解的使用简化了计算过程,并且在许多应用中是准确和有效的。然而,当光场的纵向分布很重要时,或者当存在大的横向分量变化时,标量近似解就不再适用。此时,需要使用更精确的向量解来描述光在光纤中的传播行为。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值