基于DEAP库的python进化算法--遗传算法实践--配词问题

哎呦-_-不错

于 2020-11-28 21:09:35 发布

阅读量465

点赞数

文章标签： DEAP 配词问题

本BLOG上原创文章未经本人许可，不得用于商业用途，转载请注明出处。

本文链接：https://blog.csdn.net/weixin_46649052/article/details/110290198

版权

本文探讨使用DEAP库通过遗传算法解决配词问题，比较了两种评价函数——ASCII码差异和相同字符个数，分析它们对算法收敛性的影响。实例展示了遗传算法在配词问题中的应用及不同评价方式下的运行结果。

摘要由CSDN通过智能技术生成

文章目录

一.前言

在非线性函数寻优中，我们看到了编码方式对问题求解的重要性，但是遗传算法的评价函数的设定也对求解有至关重要的作用。如果设定的评价函数不好，可能导致算法无法正确收敛。

二.配词问题

1.问题描述

配词问题(word matching problem)是给定某字符串，以生成同样字符串为目的的问题。

例如对目标短语’to be or not to be’，要求用遗传算法生成该短语。

这里最简单直接的个体编码方式是采用13个ASCII码进行编码(当然用字符编码也是可以的，这里因为探讨的主要问题在于评价函数的选择，因此，不对编码方式做过多探索)。

考虑评价函数时，有两种评价思路：

第一种思路：是将目标函数设定为与给定的字符串的ASCII码差异，此时，配词问题转化为一个目标函数最小化问题。
第二种思路：是将目标函数设定与原文相同的字符个数，此时，配图问题转化为一个目标函数最大化问题。

2.评价方式一 - ASCII码差异

遗传算法操作：

个体编码：使用ASCII码数字编码，长度为13
评价函数：与给定的字符串的ASCII码差异的绝对值之和
育种选择：锦标赛选择
变异算法：交叉-均匀交叉，变异-乱序突变
环境选择：精英保留策略
代码实现

#!usr/bin/env python
# -*- coding:utf-8 _*-
"""
@author: liujie
@software: PyCharm
@file: ASCII差异.py
@time: 2020/11/28 19:36
"""
import numpy as np
import random
import matplotlib.pyplot as plt
from deap import creator,tools,base,algorithms

# 定义问题
creator.create('FitnessMin',base.Fitness,weights=(-1.0,))
creator.create('Individual',list,fitness = creator.FitnessMin)

# 个体编码-ASCII编码
gen_size = 13
toolbox = base.Toolbox()
# 小写字母“a”到“z”的ASCII码值分别为97到到122
toolbox.register('genASCII',random.randint,97,122)
toolbox.register('Individual',tools.initRepeat,creator.Individual,toolbox.genASCII,n = gen_size)
# 注册种群
toolbox.register('Population',tools.initRepeat,list,toolbox.Individual)

# 评价函数-与给定的字符串的ASCII码差异之和
def eval(ind):
    target  = list('tobeornottobe')
    # ord返回对应ASCII字符串的ASCII数值
    target = [ord(item) for item in target]
    return np.sum(np.abs(np.array(ind) - np.array(target))),

# 注册评价函数
toolbox.register('evaluate',eval)
# 注册遗传算法的操作：选择、交叉、突变
toolbox.register('select',tools.selTournament,tournsize = 2)
toolbox.register('mate',tools.cxUniform,indpb=0.5)
toolbox.register('mutate',tools.mutShuffleIndexes,indpb = 0.3)

# 创建统计学对象
stats = tools.Statistics(key= lambda ind : ind.fitness.values)
stats.register('avg',np.mean)
stats.register('std',np.std)
stats.register('min',np.min)
stats.register('max',np.max)
# 创建日志对象
logbook = tools.Logbook()
logbook.header = 'gen','avg','std','min','max'

# 遗传算法
pop_size =  100
N_GEN = 50
CXPB = 0.8
MUTPB = 0.2

# 生成种群
pop = toolbox.Population(n = pop_size)

# 评价初代种群
invalid_ind = [ind for ind in pop if not ind.fitness.valid]
fitnesses = list(map(toolbox.evaluate,invalid_ind))
for ind,fit in zip(pop,fitnesses):
    ind.fitness.values = fit
record

最低0.47元/天解锁文章

哎呦-_-不错

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
基于DEAP库的python进化算法--遗传算法实践--配词问题

文章目录一.前言二.配词问题1.问题描述2.评价方式一 - ASCII码差异2.评价方式二 -- 与原文相同的字符个数小结一.前言在非线性函数寻优中，我们看到了编码方式对问题求解的重要性，但是遗传算法的评价函数的设定也对求解有至关重要的作用。如果设定的评价函数不好，可能导致算法无法正确收敛。二.配词问题1.问题描述配词问题(word matching problem)是给定某字符串，以生成同样字符串为目的的问题。例如对目标短语’to be or not to be’，要求用遗传算法生成该短语。
复制链接

扫一扫