![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
强化学习笔记
Swaggy_xu
这个作者很懒,什么都没留下…
展开
-
Q-routing发展以及原始实验复现
Q-routing在网络情况变化(网络负载变化,拓扑变化)情况下的 表现很好。其基于一个类似于Q-learning的更新公式:后续研究人员对Q-routing进行了各种改进1、提出了Full Echo Q-routing。节点进行路由决策前增加了轮询操作,加快了节点与节点间的信息交换,从而降低了初始化阶段峰值延迟,加速了算法的收敛. 但频繁的轮询操作也引发了高负载状态下延迟抖动的问题。...原创 2019-11-06 22:02:35 · 2633 阅读 · 11 评论 -
基于RL的路由策略
叙述了基于RL的路由策略。这种方案带来的优势,同时也存在一些问题。最后提出了一些开放性的问题。路由的任务:向用户提供端到端的服务质量保证。蚁群算法收敛慢,时间复杂度高。遗传算法:通过模拟自然进化过程搜索最优解的方法,是解决搜索问题的一种通用算法。可用来搜索最优解。存在局部收敛问题。(可以通过此求出一个次优解)ad hoc 无线自组网:由于节点移动性导致的动态拓补问题。通过RL可以更...原创 2019-10-27 10:09:52 · 977 阅读 · 0 评论