- 博客(5)
- 问答 (1)
- 收藏
- 关注
原创 DDPG(含文章与代码)
基于Deep Q-learning对连续动作空间的处理以及DPN的成功,提出了一种model-free(事先不知道环境的一切变化,这是与model-based的区别),actor-critic的算法用于解决连续空间问题。该算法可以直接对输入图片进行处理,并且表现非常优异。神经网络应用于强化学习虽然取得了较好的成果,但是DQN只可以处理离散动作空间。当然,可以通过连续动作空间离散化进行处理,但是这样会随着维度的提升,计算量指数级增长,还会导致部分信息的丢失。
2023-04-11 17:34:41
876
1
原创 第十届蓝桥杯Java B省赛真题及解析和扩展
1、组队package BBC;import java.util.Scanner;public class Main { public static void main(String[] args) { int max_count=0; int max=0; int M[][]=new int[20][6]; Scanner S=new Scanner(System.in); for(int i=0;i<M.length;i++){ for(int j=0;j<M
2021-02-20 17:33:02
597
原创 离散时间序列的傅里叶变换和基本性质
↵由连续时间序列的傅里叶变换引出离散时间序列的傅里叶变换由连续时间序列的傅里叶变换:可以以此类推离散时间序列的傅里叶变换为由于序列是离散的,所以求FT公式的时候用的累加;由于离散时间系统的FT是周期连续函数,且周期是2π(所以下面我们上下限选择的是+π),则可以直接用连续时间系统的FT公式带入。下面对离散时间系统的x(n)公式做一下验证:至于这个2π周期,简要写一下: 其中M是整数下面是一个具体实例,附加ma...
2020-09-29 17:05:31
11043
2
原创 几种常见触发器简介分析
图源来自网络,侵权请联系。基本RS触发器(与非门)分析:当S和R输入都是0的时候,那么与门只受Q和Q非的影响;当S输入为1,R输入为零的时候,很显然(G2接收到S非为零,那么整个与门输出为1)G2输出为1,那么G1输出为0;同理可以推出S输入为0,R输入为1时的情况;当S和R的输入都是1是,两个与门都接收到0,那么输出都为1,很显然这不符合Q和Q非一个为0一个为1的情况。(尤其是当S和R...
2019-11-27 21:16:26
20863
3
原创 四色环、五色环电阻的读取
颜色—数码对照表四色环电阻的读取。四色环电阻最后一环一般为金色或是银色,四色环电阻第一环和第二环取有效数字,第三环取乘数。最后一环表示误差。下面举例:(图片上最大的电阻)电阻值为25*(0.01)=0.25(欧);五色环电阻的读取。五色环电阻最后一环一般为棕色,第四第五环之间的距离相距较大。第一,第二,第三环为有效数字,第四环为乘数,第五环为误差。下面举例:电阻值为:3...
2019-11-25 21:30:54
2638
1
空空如也
anaconda打开之前为什么总会弹出几个命令框
2022-06-01
TA创建的收藏夹 TA关注的收藏夹
TA关注的人