
笔记
文章平均质量分 92
松间沙路hba
智能优化算法,深度学习,强化学习,生产调度,智能制造
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
(文末源码)差分进化(Differential Evolution,DE)
获取更多资讯,赶快关注公众号(名称:智能制造与智能调度,公众号:deeprlscheduler)吧!文章目录1、思想2、方案DE1变异交叉选择算法伪代码3、方案DE24、 源代码1、思想DE是由Rainer Storn 和 Kenneth Price于1995年提出的一种比较经典的进化算法,是一种新型并行直接搜索算法,每一代G中都利用NP个参数向量(个体)作为种群,在优化过程中NP是保持不变的。如果没有掌握一些系统的先验知识,通常初始种群是随机选择的,一般来说,除非另有说明,否则将对所有随机决策假定一原创 2020-10-01 13:59:43 · 3322 阅读 · 0 评论 -
(CMA-ES源码)协方差自适应进化策略(Covariance Matrix Adaptation Evolution Strategy,CMA-ES)——最好的单目标进化算法?
获取更多资讯,赶快关注公众号(名称:智能制造与智能调度,公众号:deeprlscheduler)吧!文章目录0 (μ/μW,λ)\left(\mu / \mu_{\mathrm{W}}, \lambda\right)(μ/μW,λ)-CMA-ES1 Set parameters参数设置2 Initialization初始化3 迭代优化过程3.1 采样新种群3.2 选择和重组:均值移动3.3 自适应协方差矩阵3.3.1 估计协方差矩阵3.3.2 秩μ\muμ更新3.3.3 秩1更新3.3.3.1 不同的视原创 2020-09-27 21:30:48 · 14722 阅读 · 8 评论 -
群体智能优化算法之鲸鱼优化算法(Whale Optimization Algorithm,WOA)
获取更多资讯,赶快关注上面的公众号吧!文章目录鲸鱼优化算法(Whale Optimization Algorithm,WOA)1.1 灵感1.2 数学建模和优化算法1.2.1 包围捕食(Encircling prey)1.2.2 气泡网攻击方式(Bubble-net attacking method)(利用阶段)1.2.3搜索猎物(Search for prey)(exploration ph...原创 2020-03-14 20:37:39 · 46918 阅读 · 44 评论 -
PyCharm使用技巧及常用快捷键
获取更多资讯,赶快关注上面的公众号吧!文章转载于https://blog.csdn.net/weixin_37292229/article/details/81737194 ...转载 2020-02-21 09:55:08 · 2493 阅读 · 0 评论 -
深度强化学习之模仿学习(Imitation Learning)
上一部分研究的是奖励稀疏的情况,本节的问题在于如果连奖励都没有应该怎么办,没有奖励的原因是,一方面在某些任务中很难定量的评价动作的好坏,如自动驾驶,撞死人和撞死动物的奖励肯定不同,但分别为多少却并不清楚,另一方面,手动设置的奖励可能导致不可控的行为。要解决此类问题,可以将人类专家的范例作为强化学习代理的参考去学习,因此模仿学习又叫演示学习(Learning by demonstration)...原创 2020-02-19 10:52:38 · 9945 阅读 · 0 评论 -
深度强化学习之稀疏奖励(Sparse Reward)
笔记详细可以点击下方链接查看:https://mp.weixin.qq.com/s/1QWYTVUdY-j8DtAxjBiSNw原创 2020-02-16 11:39:23 · 3570 阅读 · 0 评论 -
深度强化学习之演员—评论家(Actor—Critic)
原创 2020-02-15 16:20:00 · 3424 阅读 · 0 评论 -
深度强化学习之近端策略优化(Proximal Policy Optimization)
今天学习了李宏毅老师的深度强化学习课程—策略梯度和近端策略优化,其中近端策略优化是策略梯度的升级版本,并且是openai的默认强化学习算法,可见其重要性。近端策略优化可以在策略梯度的基础上,将在策略变为离策略变,并添加一定的约束得到,因此本部分内容包括策略梯度、在策略变离策略和添加约束三部分内容。 策略梯度方法是对策略参数化,然后通过梯度下降的方法对参数进行优化,从最大化期望累积奖励出发...原创 2020-02-14 10:58:03 · 6103 阅读 · 2 评论 -
深度学习之卷积神经网络
今天学习了李宏毅老师的卷积神经网络,有点相见恨晚的感觉,李老师讲的前因后果非常透彻,今天我把笔记分享出来,由于没有电脑,只能把手写笔记拍照了。卷积神经网络没准也能在调度领域发挥作用,如果将调度表达成图像,就可以和图像识别一样,提取一定的特征,这个等到疫情过去以后可以通过实验尝试一下。...原创 2020-02-12 18:29:42 · 2317 阅读 · 0 评论 -
基于深度强化学习的离散自动生产线智能调度
获取更多资讯,赶快关注上面的公众号吧!文章目录摘要结论1引言2文献综述3基于DRL的调度3.1基于深度强化学习的智能调度3.1.1加工单元的状态建模a每个加工单元的繁忙或空闲b工艺中每道工序的繁忙或空闲c多加工资源状态3.1.2运输单元的行为建模3.1.3奖励建模3.1.4调度策略建模3.1.5调度算法学习迭代3.2离散事件仿真环境和基于深度强化学习的调度仿真算法4调度实验4.1线...原创 2020-02-11 17:24:02 · 7567 阅读 · 11 评论