自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_61897765的博客

原创 [论文阅读]JTORO in NOMA-based VEC:A game-theoretic DRL approach

论文：Joint task offloading and resource optimization in NOMA-based vehicular edge computing: A game-theoretic DRL approach。

2024-09-01 21:41:02 2104 2

原创 [论文阅读]Mobility-Aware Cooperative Caching in VEC Based on CAFR

论文：Mobility-Aware Cooperative Caching in Vehicular Edge Computing Based on Asynchronous Federated and DRLJSTSP 2022。

2024-08-09 19:40:53 1873 3

原创 [RL] 马尔可夫决策过程基础

强化学习马尔可夫过程基础

2024-07-21 12:22:03 1191

原创 User Allocation In MEC: A DRL Approach 论文笔记

论文：ICWS 2021随着对低延迟需求的增加，边缘计算或雾计算逐渐成为主流。当前最先进的技术假设边缘服务器上的等于从边缘服务器提供的的。然而，的与之间通常存在高度的关系，尤其CPU-GPU协同执行，使资源利用率的数学建模异常复杂。目前用于解决问题的算法普遍假设与呈假设是的。然而，实际服务过程中资源使用量是的，难以通过数学建模精确描述。提出一种框架来解决问题，基于与MEC系统的经验和交互逐步学习。DRL Agent在服务延迟阈值约束下学习在某上服务的。DRL Agent。

2024-07-21 11:47:50 1449 1

原创 Reinforced Causal Explainer for GNN论文笔记

论文笔记

2024-07-14 18:24:56 1251 1

原创 DROO论文笔记

读论文的笔记

2024-07-14 16:11:50 1929 2

原创 [RL] Actor-Critic、A2C、A3C、DDPG、TD3基础概述

好几个月之前学的了，当时手懒没总结，突然闲下来补个笔记

2024-07-08 15:21:33 2136

原创 [os] LRU 页面置换算法

【代码】[os] LRU 页面置换算法。

2024-07-08 14:36:28 278

原创 [RL]优先经验回放(PER-DQN)原理及代码实现

DQN变体

2024-03-15 20:04:01 12301 13

原创 [RL]DQN、DDQN、DuelingDQN原理、代码实现

因为有时候我们更新的时候，不一定是更新 Q 表格，而是只更新了 V (s)，但更新 V (s) 的时候，只要修改 V (s) 的值，Q 表格的值也会被修改。蓝色的锯齿状的线是 DDQN 的 Q 网络所估测出来的 Q 值，蓝色的无锯齿状的线是真正的Q 值，它们是比较接近的。假设估计噪声为高斯，无偏均值为0，误差可正可负，到此并无大碍，但是接下来的更新时的操作计算TD-target的时候，使用了max操作，这导致在这一步的误差始终为正的，造成正的偏差，这就是导致高估的原因。但是在估计的时候，网络是有误差的。

2024-03-11 16:05:50 3310

原创 [RL]策略梯度REINFORCE

pytorch

2024-02-13 23:12:14 1244

原创 [DL](DCGAN)生成对抗网络代码实现

深度学习上机作业10

2023-12-11 19:30:19 1295

原创 [RL]强化学习入门-DQN基础

基础

2023-12-08 15:53:52 1302

原创 [深度学习]pytorch实现sigmoid、softmax、交叉熵loss函数

入门

2023-10-04 16:24:07 1085 1

原创 [数据结构与算法] 三足鼎立PTA

小学期

2023-07-07 19:26:28 1012 1

原创 [数据结构与算法]符号配对PTA

小学期

2023-07-06 22:36:14 1475 1

原创多重继承- 菱形继承(钻石继承)问题记录

问题记录

2023-06-29 23:10:05 127 1

原创 [Python]属性的使用- 访问器/修改器/删除器、静态方法/类方法

python自学

2023-06-29 14:25:55 1167 1

原创 [韩顺平MySQL]自学记录（2）

自学

2023-02-06 12:44:03 726

原创［Python] 自学记录之数据可视化

自学

2023-02-05 22:12:37 709

原创［Python] 自学记录之面向对象

自学

2023-02-01 23:10:59 622

原创 [韩顺平MySQL]自学记录（1）

自学

2023-01-31 22:06:30 691

原创 [计算方法]上机

自用

2022-11-10 22:57:46 401

原创 [数据结构] 笛卡尔树PTA

自学

2022-10-30 19:17:23 599

原创 [数据结构]是否完全二叉搜索树PTA

PTA自学

2022-10-16 21:03:58 1685 1

原创 [数据结构]银行业务队列简单模拟PTA

。

2022-10-16 15:17:20 8109 1

原创 [DS自学]进阶实验2-3.3 两个有序链表序列的交集PTA

自学pta题目

2022-10-04 17:50:36 176

原创【数据结构】一元多项式的乘法与加法运算

自学PTA

2022-09-27 22:42:52 195

原创【数据结构-起步能力自测题】自测-2 素数对猜想

。

2022-09-18 17:05:06 118

原创数据分析第二章学习

1.计算一句话中单词个数s1="swh wsh wsh awis"print(len(s1.split())) #>>4

2022-05-06 15:20:35 459 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

我思故我在Fighting

博客等级

码龄5年

30
原创

353
点赞

597
收藏

298
粉丝

关注

私信

热门文章

分类专栏

最新评论

[RL]优先经验回放(PER-DQN)原理及代码实现
weixin_57775233: 你好，我也有这个问题，好像是在抽样的时候抽到一个还未被填充的经验位，而那个经验位的优先级是0，但是我不知道怎么解决这个问题，你解决这个问题了吗
[论文阅读]JTORO in NOMA-based VEC:A game-theoretic DRL approach
故意装深沉啊: Xvet 和 Xve‘t 相同吗，任务处理时间nvet ，后面的求和是什么啊
[RL]优先经验回放(PER-DQN)原理及代码实现
张涵瑞: 为什么我的代码会报错File "D:\UAV\re_allocation\DQN.py", line 127, in sample state, action, reward, next_state, done = zip(*batch) TypeError: 'int' object is not iterable 请问是哪里的问题，找了好久找不出来
[RL]优先经验回放(PER-DQN)原理及代码实现
kinderkindme: 请教一下作者，为什么用环境输出的reward就没效果呢，必须要用自定义的reward？
[RL]优先经验回放(PER-DQN)原理及代码实现
owensher: 作者大大，我这边使用修改后的代码还是会报错 Traceback (most recent call last): File "C:\Users\lenovo\pythonProject\per_DQNexample.py", line 219, in <module> s_,r,done,_,info=env.step(a)#改动添加,_ ValueError: not enough values to unpack (expected 5, got 4)

提示

确定要删除当前文章？

取消删除