遗传算法 | 根据建立的优化目标全局搜索最优解 |
|
---|---|---|
多臂赌博机 | 通过调整分配给各个竞争者的资源比例,在最大化本身的收益和满足其他设备的收益间折衷 |
|
Q-learning | 通过在特定的状态执行能够使累积收益最大的行动得到最优的资源分配策略 | 适用于系统模型未知和网络环境随机变化的情况 |
无线资源分配方法(笔记)
最新推荐文章于 2022-12-11 21:12:44 发布
遗传算法 | 根据建立的优化目标全局搜索最优解 |
|
---|---|---|
多臂赌博机 | 通过调整分配给各个竞争者的资源比例,在最大化本身的收益和满足其他设备的收益间折衷 |
|
Q-learning | 通过在特定的状态执行能够使累积收益最大的行动得到最优的资源分配策略 | 适用于系统模型未知和网络环境随机变化的情况 |