RPBSO:带有角色扮演策略的BSO

本文介绍了一种名为RPBSO(Role-playing BrainStorm Optimization)的算法,它结合了角色扮演策略和差异化想法,通过在头脑风暴过程中区分创新、保守和普通想法来增强搜索效率。该算法通过重新初始化操作保持多样性和避免局部最优,详细阐述了不同角色类型及其在解决问题上的作用,并提供了RPBSO的伪代码实现和新想法生成方法。
摘要由CSDN通过智能技术生成

RPBSO:带有角色扮演策略的BSO

参考文献
《Enhanced Brain Storm Optimization with Role-playing Strategy》

要点

在RPBSO中,采用角色扮演策略来分类想法,并且利用想法差异策略来产生新的想法。为了维持想法的多样性并防止陷入局部最佳,还采用重新初始化操作。

提议的RPBSO

头脑风暴过程中的参与者扮演三种类型的角色。

  • 第一种类型的角色是创新的人
  • 第二种类型是更保守的人
  • 第三种类型是普通人

这三种类型的人通过头脑风暴过程提出的想法是创新的思想,保守思想和普通思想。

  • 创新的想法是解决当前问题的更好的想法,并且接近最好的想法。在多模态函数中,创新的想法主要是在当前峰值上执行局部搜索以找到更好的想法。
  • 保守的想法是适合解决目前问题并远离最好的想法。因为在多模态函数中不同峰之间的距离很远。保守的想法对于寻找不同的山峰来寻找更好的想法。
  • 普通的想法在解决当前问题方面并不是很有效。多模态函数中的普通思想是执行全局搜索以找到好的想法。

所有拟议的想法都通过角色扮演策略分为这三个聚类。在头脑风暴的过程中,个体通过选择一个想法或组合的想法来创造一个新的想法。RPBSO算法伪代码如下算法2:

在这里插入图片描述

A、角色扮演策略

角色扮演策略将所有想法聚集成三个聚类,代表创新思想,保守思想和普通思想。利用适应度值来评估想法的质量,并采用欧几里德距离来表示专业背景之间的差异。

首先,生成最初的想法。然后计算每个想法Xi和最佳主意Xbest之间的适应度值差异,并用符号表示为:

在这里插入图片描述

所有Δfi都用于计算平均值Δfmean,如下所示:

在这里插入图片描述

其中NI是想法的大小,值得注意的是,当索引i等于最佳主意的索引时,Δfi为零。在获得Δfmean之后,在集合A中收集Δfi小于Δfemem的所有想法,集合A的数学公式描述如下:

在这里插入图片描述

类似于Δfi和Δfmem,Δdi被定义为想法Xi和最佳主意Xbest之间的欧几里德距离,Δdmean是欧几里德距离的平均值。 Δdmean根据以下公式计算

在这里插入图片描述

Δdi小于Δdmean的思想被收集在集合B中。设定B的公式表示如下:

在这里插入图片描述

在当前的想法中,集合A包含良好适应度值的所有想法。根据创新思想和保守思想的定义,可以看出,对于多模态问题,集合A含有两种不同位置的想法,第一个包含接近最好的想法的想法,另一个离最好的想法很远,在其他地方附近。

但是集合B包含接近最好的想法。这意味着在集合B中存在良好的适应度值的想法。可以知道,集合A和集合B都包括周围最佳想法的想法,并具有解决这个问题的更好思路。

因此,NI个思想被集合A和集合B的操作分为三个聚类。第一聚类中的所有想法都称为创新思想,集合I被用来表达这种想法。集合I包含具有良好适应度值的想法,并接近最好的主意。集合C表示保守的思想,将良好的适应度值和远离最佳创意的想法与集合C。其余的想法位于第三聚类中,由集合O表示,O被称为普通的思想想法。数学表达式定义如下:

在这里插入图片描述

由下图解释。

在这里插入图片描述
在这里插入图片描述

B、新想法生成方法

采用MBSO中的IDS方法。

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值