- 博客(5)
- 收藏
- 关注
原创 A Closer Look at Invalid Action Masking in Policy Gradient Algorithms 论文阅读
对强化学习中的无效动作进行掩码处理的实现手段以及理论证明!
2024-03-06 23:32:35 1715
原创 Learning Combinatorial Optimization Algorithms over Graphs(强化学习+图神经网络)
基于图神经网络和强化学习的文章
2023-10-18 20:42:55 229 2
原创 TDOA-GDOP计算
TDOA-GDOP计算背景TDOA定位是一种利用时间差进行定位的方法。通过测量信号到达监测站的时间,可以确定信号源的距离。利用信号源到各个监测站的距离(以监测站为中心,距离为半径作圆),就能确定信号的位置。一个目标点:E(x,y,z)E(x,y,z)E(x,y,z)四个测向站:S0(x0,y0,z0),S1(x1,y1,z1),S2(x2,y2,z2),S3(x3,y3,z3),S_0(x_0,y_0,z_0),S_1(x_1,y_1,z_1),S_2(x_2,y_2,z_2),S_3(x_3,y_
2023-10-18 20:37:53 563
原创 一篇文章了解LSTM
在二十世纪中叶,模拟人类实际神经网络的数学方法问世,随着理论的逐步完善,人工构建的神经网络在系统辨识、模式识别、智能控制等领域有着广泛而吸引人的前景。而在人工神经网络的发展过程中,也出现了一些体系较为完善,在解决不同方面问题呈现不同性能的神经网络模型,比如全连接神经网络(FNN)、卷积神经网络(CNN)、循环神经网络(RNN)等。其中RNN的使用主要是用于文本填充、时间序列、语音识别等序列数据,但是在序列数据处理时,RNN在解决长序列训练过程中会产生的梯度消失 、梯度爆炸等问题。
2022-11-27 16:23:57 1620 1
免费!!!天授库0.4.6版本中文文档
2024-03-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人