深度学习
文章平均质量分 56
古道西风瘦码
2021级大头。
展开
-
pycharm配置解释器
可以配置多个pycharm解释器原创 2022-12-11 11:39:49 · 138 阅读 · 0 评论 -
策略梯度算法的理解
文章目录前言一、来源?1. DQN的缺陷二、使用步骤1.引入库2.读入数据总结 前言 策略梯度(Policy Gradient, PG)的通俗介绍。 一、来源? 1. DQN的缺陷 深度学习是监督学习,需要有标签数据来计算损失函数,通过梯度下降和误差反向传播来更新神经网络的参数,那在强化学习中如何获得标签呢? Rt+1+γmaxaQ(St+1,a;θ) R_{t+1}+\gamma \underset{a}{\max}Q\left( S_{t+1},a;\theta \right) Rt+1+γ原创 2022-04-16 22:23:59 · 1091 阅读 · 0 评论 -
pytorch和GPU
文章目录前言一、pytorch是什么?二、使用步骤1.引入库2.构建基本数据总结 前言 pytorch调用GPU 一、pytorch是什么? 通俗的讲,里面包括众多深度学习模块,简单使用过后就入门了。 二、使用步骤 1.引入库 代码如下(示例): import torch # todo 判断GPU是否可用 use_gpu = torch.cuda.is_available() 2.构建基本数据 包括一些训练集,分别用trX和trY表示,模型用model表示 trX = torch.Tensor([原创 2022-04-13 09:41:42 · 1106 阅读 · 0 评论