自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 A Closer Look at Invalid Action Masking in Policy Gradient Algorithms 论文阅读

对强化学习中的无效动作进行掩码处理的实现手段以及理论证明!

2024-03-06 23:32:35 1715

原创 Learning Combinatorial Optimization Algorithms over Graphs(强化学习+图神经网络)

基于图神经网络和强化学习的文章

2023-10-18 20:42:55 229 2

原创 TDOA-GDOP计算

TDOA-GDOP计算背景TDOA定位是一种利用时间差进行定位的方法。通过测量信号到达监测站的时间,可以确定信号源的距离。利用信号源到各个监测站的距离(以监测站为中心,距离为半径作圆),就能确定信号的位置。一个目标点:E(x,y,z)E(x,y,z)E(x,y,z)四个测向站:S0(x0,y0,z0),S1(x1,y1,z1),S2(x2,y2,z2),S3(x3,y3,z3),S_0(x_0,y_0,z_0),S_1(x_1,y_1,z_1),S_2(x_2,y_2,z_2),S_3(x_3,y_

2023-10-18 20:37:53 563

原创 基于AOA定位的GDOP计算

各站点误差的标准差已知情况下,求解定位精度!

2023-10-18 20:32:39 992 2

原创 一篇文章了解LSTM

​ 在二十世纪中叶,模拟人类实际神经网络的数学方法问世,随着理论的逐步完善,人工构建的神经网络在系统辨识、模式识别、智能控制等领域有着广泛而吸引人的前景。而在人工神经网络的发展过程中,也出现了一些体系较为完善,在解决不同方面问题呈现不同性能的神经网络模型,比如全连接神经网络(FNN)、卷积神经网络(CNN)、循环神经网络(RNN)等。其中RNN的使用主要是用于文本填充、时间序列、语音识别等序列数据,但是在序列数据处理时,RNN在解决长序列训练过程中会产生的梯度消失 、梯度爆炸等问题。

2022-11-27 16:23:57 1620 1

免费!!!天授库0.4.6版本中文文档

这个库是清华大学开发的深度强化学习库,该文档为库的使用手册,并非最新版的tianshou的手册,但是基本内容是一致的,可以供大家参考学习! 0积分就可以下载啦!大家一起加油!

2024-03-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除