code120302-CSDN博客

原创无人机使能的边缘计算优化问题

系统中移动用户的数量M、移动用户的位置(x,y,0)、任务的CPU频率C、任务的数据量D都是已知的，而无人机数量N、无人机位置(X,Y,H)是未知的。上层负责优化UAV的部署，下层负责优化任务调度。在上层中，UAV的部署问题是一个可变长度的优化问题，在进化算法中引入一种新的编码机制，使得每个individual都有固定长度（2维，位置的x坐标和y坐标）个任务【疑问：资源的分配通过任务执行数来界定有一定偏颇，若任务种类相似可以这样定义，若任务种类不相似，任务大小的方差太大，对于资源的分配利用并非高效的】

2024-07-16 15:38:39 1195

原创【强化学习】公平性Actor-Critic算法

公平性Actor-Critic算法

2024-05-07 20:04:26 993

原创深度强化学习框架Acme【一】

Acme框架学习笔记

2024-05-04 22:11:25 772

原创无线信道传输模型（LoS/ NLoS OMA/ NOMA)

无线信道传输模型

2024-04-26 16:10:57 2947

原创无人机辅助任务卸载

论文笔记

2024-04-10 11:33:05 1081

原创生成扩散模型在网络优化方面的应用

生成扩散模型(Generative Diffusion Models, GDMs)具有建模复杂数据分布和生成高质量样本的能力，基于此，GDMs常常被用来执行例如图片生成等任务，随着6G的不断建设与探索，网络规模逐步扩大，网络状态愈加复杂，学习复杂网络中潜在的信息和依赖关系是十分重要的。

2024-04-02 16:56:59 1024

原创 DRL调参笔记

drl调参笔记

2024-02-05 20:54:16 871

原创《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记

论文笔记

2023-12-10 15:54:47 1073

原创《Joint Caching and Transmission in the Mobile Edge Network: An Multi-Agent Learning Approach》阅读笔记

比如如果在t时刻服务器e中缓存的文件为{1, 2, 3}，agent采取的动作为删除文件1替换为文件4，那么t+1时刻服务器e中缓存的文件为{4, 2, 3}。caching network基于多智能体学习预测和存储用户感兴趣的文件，网络的输入为请求文件和用户接入信息，输出为缓存决策x，每个边缘服务器作为agent学习缓存策略。疑问：这里的奖励函数定义为边缘服务器与用户之间传输时延最小，若边缘服务器只缓存一个文件岂不是此时的传输时延最小，r最大吗？当a(t)=0时，说明请求的文件在缓存中，不进行替换。

2023-11-29 22:07:18 95

原创贝叶斯学习自动机

step2：再次画出图像选择，得到随机变量x2 > x1, 选择arm2并获得了奖励，更新选择两个arm的Beta分布，估计arm2获得奖励的概率下降，agent选择arm1的概率变成0.5。step3：第三次选择中，x1 > x2，选择arm1并获得了奖励，更新选择两个arm的Beta分布，估计arm1获得奖励的概率上升，agent选择arm1的概率变成0.7。其中，一般用Beta分布作为先验分布。：对于伯努利分布，用Beta分布作为先验分布，通过贝叶斯推断后得到的后验分布依然时Beta分布的特性。

2023-11-23 23:12:24 93

原创多智能体解决数据缓存

经验回放（Experience Replay）是强化学习中的一个技术，旨在改善学习的效率和稳定性。在实时与环境交互中获得的经验（状态、动作、奖励等）通常会被立即用于更新模型。这种做法可能非常低效和不稳定。经验回放通过存储这些经验到一个称为“经验回放缓冲区”的数据结构中，然后在训练过程中随机抽样以用于模型更新，从而解决了这一问题。固定边缘节点之间、边缘节点和数据中心之间的数据率。真实世界数据集MovieLens。

2023-11-17 21:56:52 78 1

原创 pytorchviz安装

【代码】pytorchviz安装。

2023-11-15 15:24:47 155 1

原创《Data Caching Optimization in the Edge Computing Environment》论文阅读笔记

阅读笔记

2023-11-10 10:16:44 134 1

原创集合覆盖问题的模型与算法

集合覆盖问题的模型与算法

2023-11-08 09:20:31 4620 1

原创边缘-云在AIGC领域的应用与发展

论文理解

2023-11-04 11:36:03 202 2

原创马尔可夫决策过程详解

RL本质是互动学习，让智能体与外界环境进行交互，其目标是使得agent在与环境的交互中得到最大的累计reward，从而学习到自身动作的最优控制。RL模型中三个关键部分：（1）状态(state)：外界环境信息，状态体现环境的特征。（2）动作(action)：感知环境后采取的行为，动作的表现形式可以是离散的，也可以是连续的。（3）奖励(reward)：采取行动后获得的收益值，收益根据实际场景可以时正的也可以是负的。

2023-11-03 16:46:45 1602 2

原创 GAP问题近似算法

近似比：A是问题I的近似算法，OPTA是问题I的最优算法，则定义近似算法A的近似比率为：最小化问题的近似比：近似比率总是>=1，近似比越小，算法越好。相对误差界：若对于输入规模为n的问题，存在一个函数ϵ\epsilonϵ(n)使得：优化问题近似方案：把近似算法A的近似比满足如下条件：称为优化问题的近似方案。

2023-10-29 16:47:35 367 1

原创《Mobility-Aware Computation Offloading in Edge Computing Using Machine Learning》论文阅读笔记二

笔记2

2023-10-29 11:40:07 88 1

原创《Mobility-Aware Computation Offloading in Edge Computing Using Machine Learning》论文阅读笔记一

关于计算卸载的理论研究较为广泛，绝大部分将问题建模成为整数规划/混合整数规划问题等，通过采用凸优化理论，启发式算法，博弈论，排队论，马尔可夫决策，深度强化学习等方法进行近似求解。A[10 + 8].b = A[10].b + b3 = 6 + 4 = 10，A[10 + 8].p = A[10].p + p3 = 5 + 1 = 6，代价为18时，分配策略为app196、app143。其中，xi/yi为app的位置，md为迁移数据量，id为卸载数据量，w为计算所需指令数，p为所需处理速度，b为所需带宽。

2023-10-28 23:20:25 102 1

code120302的博客

原创无人机使能的边缘计算优化问题

原创【强化学习】公平性Actor-Critic算法

原创深度强化学习框架Acme【一】

原创无线信道传输模型（LoS/ NLoS OMA/ NOMA)

原创无人机辅助任务卸载

原创生成扩散模型在网络优化方面的应用

原创 DRL调参笔记

原创《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记

原创《Joint Caching and Transmission in the Mobile Edge Network: An Multi-Agent Learning Approach》阅读笔记

原创贝叶斯学习自动机

原创多智能体解决数据缓存

原创 pytorchviz安装

原创《Data Caching Optimization in the Edge Computing Environment》论文阅读笔记

原创集合覆盖问题的模型与算法

原创边缘-云在AIGC领域的应用与发展

原创马尔可夫决策过程详解

原创 GAP问题近似算法

原创《Mobility-Aware Computation Offloading in Edge Computing Using Machine Learning》论文阅读笔记二

原创《Mobility-Aware Computation Offloading in Edge Computing Using Machine Learning》论文阅读笔记一

原创 Leetcode685 冗余连接II 题解思路及实现

原创《算力网络中高效算力资源度量方法》论文解读与实验复现

原创决策树之CART算法分类树原理及python实现

原创 RPL协议仿真理解

原创《IETF 6TiSCH工业物联网研究综述：标准、关键技术与平台》阅读笔记

原创《6G算力网络：体系架构与关键技术》阅读笔记

原创 Android Studio 在蓝屏后出现import包标红解决方法

原创 CSAPP Lab 2 Bomb小记三

原创 CSAPP Lab 2 Bomb小记二

原创 CSAPP Lab2 Bomb小记一

空空如也

空空如也