粒子群算法通识

粒子群算法(Particle swarm optimization,PSO)是模拟群体智能所建立起来的一种优化算法,主要用于解决最优化问题(optimization problems)。1995年由 Eberhart和Kennedy 提出,是基于对鸟群觅食行为的研究和模拟而来的。

假设一群鸟在觅食,在觅食范围内,只在一个地方有食物,所有鸟儿都看不到食物(即不知道食物的具体位置。当然不知道了,知道了就不用觅食了),但是能闻到食物的味道(即能知道食物距离自己是远是近。鸟的嗅觉是很灵敏的)。

这里写图片描述

假设鸟与鸟之间能共享信息(即互相知道每个鸟离食物多远。这个是人工假定,实际上鸟们肯定不会也不愿意),那么最好的策略就是结合自己离食物最近的位置和鸟群中其他鸟距离食物最近的位置这2个因素综合考虑找到最好的搜索位置。
粒子群算法与《遗传算法》等进化算法有很多相似之处。也需要初始化种群,计算适应度值,通过进化进行迭代等。但是与遗传算法不同,它没有交叉,变异等进化操作。与遗传算法比较,PSO的优势在于很容易编码,需要调整的参数也很少。

一、基本概念

与遗传算法类似,PSO也有几个核心概念。

  1. 粒子(particle):一只鸟。类似于遗传算法中的个体。
  2. 种群(population):一群鸟。类似于遗传算法中的种群。
  3. 位置(position):一个粒子(鸟)当前所在的位置。
  4. 经验(best):一个粒子(鸟)自身曾经离食物最近的位置。
  5. 速度(velocity ):一个粒子(鸟)飞行的速度。
  6. 适应度(fitness):一个粒子(鸟)距离食物的远近。与遗传算法中的适应度类似。
二、粒子群算法的过程

这里写图片描述

可以看出,粒子群算法的过程比遗传算法还要简单。
1)根据问题需要,随机生成粒子,粒子的数量可自行控制。
2)将粒子组成一个种群。这前2个过程一般合并在一起。
3)计算粒子适应度值。
4)更新种群中每个粒子的位置和速度。
5)满足退出条件就退出,不满足就转向步骤3)。

三、核心—“速度更新”

从上面PSO的算法流程中可以看出,核心步骤是更新种群中每个粒子的位置和速度,而速度的更新又是核心中的核心。

下面直接给出速度更新公式:

new_v=wv+c1rand()(pbestposition)+c2rand()(gbestposition)

v为粒子当前的速度,w为惯性因子(有速度就有运动惯性)。rand()为随机数生成函数,能够生成0-1之间的随机数。position为粒子当前的位置,pbest为本粒子历史上最好的位置,gbest为种群中所有粒子中当前最好的位置。c1和c2表示学习因子,分别向本粒子历史最好位置和种群中当前最好位置进行学习。

参数好像也有很多,需要设置的是3个,w,c1和c2,但实际上一般都设置c1=c2=1,w一般设在0.5左右。所以也没什么好设置的。

从物理原理上来解释这个速度更新公式,该公式由加号分割为3个部分:

第一部分是惯性保持部分,粒子沿着当前的速度和方向惯性飞行,不会偏移,直来直去。(牛顿运动学第一定理)。

第二部分是自我认知部分,粒子受到自身历史最好位置的吸引力,有回到自身历史最好位置的意愿。(牛顿运动学第二定理)。

第三部分是社会认知部分,粒子处在一个社会中(种群中),社会上有更好的粒子(成功人士),粒子受到成功人士的吸引力,有去社会中成功人士位置的意愿。(牛顿运动学第二定理)。

速度更新公式的意义就是粒子在自身惯性和2种外力作用下,速度和方向发生的改变。

注意这3部分都有重要含义。没有惯性部分,粒子们将很快向当前的自身最优位置和全局最优粒子位置靠拢,变成了一个局部算法了。有了惯性,不同粒子将有在空间中自由飞行的趋势,能够在整个搜索区域内寻找食物(最优解)。而没有自我认知部分,粒子们将向当前的全局最优粒子位置靠拢,容易陷入局部最优。没有社会认知部分,粒子们各自向自身最优位置靠拢,各自陷入自身最优,整个搜索过程都不收敛了。

最后,有了速度更新公式,位置更新就简单了:

new_position=position+new_vt

t一般默认取1。 这里写链接内容

  • 6
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值