![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
文章平均质量分 55
yanxiaoyu110
在求道的道路上一去不复返
展开
-
【深度强化学习】深度Q网络求解倒立摆问题+Pytorch代码(1)
广泛地讲,强化学习是机器通过与环境交互来实现目标的一种计算方法。机器和环境的一轮交互是指,机器在环境的一个状态下做一个动作决策,把这个动作作用到环境当中,这个环境发生相应的改变并且将相应的奖励反馈和下一轮状态传回机器。这种交互是迭代进行的,机器的目标是最大化在多轮交互过程中获得的累积奖励的期望。强化学习用**智能体(agent)**这个概念来表示做决策的机器。''' 经验回放池 '''self.buffer = collections.deque(maxlen=capacity) # 队列,先进先出。原创 2024-05-18 22:35:31 · 594 阅读 · 0 评论 -
跟着沐神学深度学习-从入门到放弃的第3天(多层感知机实现)
至于为什么在多层感知机中加入激活函数,原因是因为,如果没有激活函数,那么多层其实大型的。, 我们还需要一个额外的关键要素: 在仿射变换之后对每个隐藏单元应用非线性的激活函数。:所谓多层感知机,其实就是将多个线性层进行串联,从而形成下图的形式。原创 2023-10-28 16:58:48 · 57 阅读 · 1 评论 -
跟着沐神学深度学习-从入门到放弃的第2天(基于softmax的图像分类问题以及简洁实现)
今天学习到了基于的图像分类问题。其本质就是将数据进行为区间[0,1]的概率问题选择问题。原创 2023-10-27 22:14:49 · 78 阅读 · 1 评论 -
跟着沐神学深度学习---从入门到放弃的第0天(数据操作)
如上面代码中,首先将两个张量维度向右靠齐,从右往左看,两个张量第四维大小相等,都为1,满足上面条件a;第三个维度大小不相等,但第二个张量第三维大小为1,满足上面条件b;第一个维度第一个张量有,第二个张量没有,满足上面条件b,因此两个张量每个维度都符合上面广播条件,因此可以进行广播。为了说明这一点,我们首先创建一个新的矩阵Z,其形状与另一个Y相同, 使用zeros_like来分配一个全。c.某个维度 一个张量有,一个张量也有但大小是1。b. 某个维度 一个张量有,一个张量没有。[3]. 张量转数组。原创 2023-10-24 15:45:14 · 42 阅读 · 0 评论 -
跟着沐神学深度学习---从入门到放弃的第1天
【代码】跟着沐神学深度学习---从入门到放弃的第1天。原创 2023-09-20 20:59:31 · 68 阅读 · 1 评论