强化学习
文章平均质量分 58
Abo_luo
竹杖芒鞋轻胜马,一蓑烟雨任平生
展开
-
强化学习——Qlearning和Sarsa的区别
强化学习——Qlearning和Sarsa的区别前言Qlearning算法简单示例Sarsa算法简单示例总结主要是讲述一下自己学习Qlearning和Sarsa的感悟前言自从北京学习回到成都,一个暑假虽然”书本上“的知识没有学到什么,但是确实让身为本科生的自己眼界开阔了很多,也更加的明确了自己的目标。强化学习这一个领域之前也是仅仅知识了解大概的算法流程,知其然,不知其所以然。直到现在我也觉得其和遗传学习很相似,难道他们之间是包含与被包含的关系?(需要再继续学习才能去了解了)本篇口水话主要是讲述一原创 2021-08-28 10:37:33 · 1913 阅读 · 0 评论 -
最短距离:遗传算法改进——python实现
最短距离:遗传算法改进——python实现前言遗传算法实现总结针对上一篇文章,实现改进的部分前言在数学建模中经典的问题——最优距离,遍历可能是我们找到最优距离的最好办法。但是如果面对众多的需要优化的位置,那么计算量将会特别大,如有二十个位置,那么遍历需要的次数为20的阶乘次,计算量可想而知的恐怖,因此引入遗传算法遗传算法实现import numpy as npimport matplotlib.pyplot as pltpop_size = 500 #每次计算的方案数量,也就是原创 2021-08-11 23:58:21 · 358 阅读 · 0 评论 -
最短距离——遗传算法
最短距离:遗传算法——python实现前言遗传算法实现总结最近闲来无聊,学一下遗传算法来充实自己前言在数学建模中经典的问题——最优距离,遍历可能是我们找到最优距离的最好办法。但是如果面对众多的需要优化的位置,那么计算量将会特别大,如有二十个位置,那么遍历需要的次数为20的阶乘次,计算量可想而知的恐怖,因此引入遗传算遗传算法实现import numpy as npimport matplotlib.pyplot as pltcity_position = np.random.rand(2原创 2021-08-11 19:49:43 · 892 阅读 · 1 评论 -
强化学习——Policy-based Approach
强化学习——Policy-based Approach前言Policy-base approach思想笔记总结根据李宏毅老师的视频,记录一下自己的学习心得前言本科已经毕业了,从刚开始接触传统的机器学习,到后面接触到深度学习、CV检测、NLP等,但是最近看到越来越多的人开始提到强化学习,因此自己也打算乘着这段“闲暇”时间来学习一下强化学习,仅仅用于记录自己的学习,如果能为您提供帮助当然再好不过。Policy-base approach思想 主要分为三步:1、Nerual network as原创 2021-08-17 14:28:50 · 289 阅读 · 0 评论