自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 资源 (1)
  • 收藏
  • 关注

原创 强化学习中的MASK掩码约束动作action

在强化学习解决问题的场景中,动作是体现学习效果最直接的因素,直接影响了智能体下一步的走向和对环境状态的改变。在应用强化学习解决实际问题时,往往不同于gym库中倒立摆那样的情况,而是存在很多的约束。例如,在ttt时刻智能体可选的动作为1,2,31,2,31,2,3,但是在t+1t+1t+1时刻只能选1,21,21,2,333处于不可用的状态。在这种情况下,就需要借助掩码mask来对智能体的动作进行处理。有人会疑问:就不能制定相应的奖励函数使得智能体学习到这种约束吗?这样做是可以的,但是付出的训练代价很大,

2021-07-13 20:50:00 8557 12

原创 看待神经网络的两种角度

神经网络包括DNN、CNN、RNN以及其他变体网络结构,主要用于拟合历史数据,预测未来数据。神经网络的核心在于反向传播梯度,使得网络能够拟合历史数据的分布。最近一段时间看了一些相关顶会的论文,发现大佬们看待神经网络主要有两个角度,总结如下:1 认为神经网络是特征提取器这种角度更符合大多数计算机视觉领域的看法,认为神经网络实现的是特征的非线性映射和提取,实现深层与浅层特征的分离。在这种角度下,神经网络的每一层都被赋予不同的涵义,其中一般其代表的特征矩阵会随着网络层数的增多而逐渐加深,并将最后一层作为最后的

2021-07-07 11:54:47 208 2

pyqt_diaoyong_multiwindow.zip

使用PyQt4 + QT designer + python3.7环境搭建了一套多窗口调用的模板,里面包括配置好的调用关系,以及一些按钮事件框架,还有部分QSS内容。

2019-06-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除