一文带你理解算法策略

hzbooks

于 2022-03-24 08:00:00 发布

阅读量4.4k

点赞数

文章标签：算法分布式大数据编程语言 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hzbooks/article/details/123725790

版权

本文介绍了三种常见的算法策略：分治策略，通过将大问题分解为独立的子问题来解决；动态规划策略，利用记忆化技术避免重复计算，优化递归问题；贪心算法，通过每一步选择局部最优解快速求解问题，但可能无法得到全局最优解。以Apache Spark的分治策略为例，展示了其在分布式计算中的应用。

摘要由CSDN通过智能技术生成

一个精心设计的算法尽可能地将问题划分为更小的子问题，从而最大限度地优化可用资源的使用。设计算法有不同的算法策略，算法策略包含下面列出的三种典型策略，还有些策略没有列入进来。

这里，我们介绍以下三种策略：

分治策略
动态规划策略
贪心算法策略

01

分治策略

分治策略就是找到一种方法，将规模较大的问题分解成可以相互独立解决的规模较小的子问题，然后将这些子问题产生的解合并起来，生成问题整体的解，这就是所谓的分治策略。

从数学上讲，如果问题（P）有n个输入且需要对数据集d进行处理，则用分治策略为问题设计求解方案会将问题分解成k个子问题，记为P₁至P_k，每个子问题将处理数据集d的一个分区。通常，假设P₁至P_k依次处理数据分区d₁至d_k。

我们看一个实例。

实例—适用于Apache Spark的分治策略

Apache Spark是一个用于解决复杂分布式问题的开源框架，它使用了分治策略来解决问题。为了处理问题，它将问题分为多个子问题，并且彼此独立地处理。我们将通过从一个列表中计数单词的简单的例子来说明这一点。

假设我们有以下单词列表：

我们要计算此列表中每个单词出现的频率。为此，我们将采用分治策略来有效解决此问题。

图4-3展示了分治策略的实现流程。

在图4-3中，我们将一个问题

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。