Cary.-CSDN博客

原创 gym库中core.py代码解读

gym项目文件中的core.py文件

2022-08-29 16:40:17 3588 1

原创 DCGAN（2）代码阅读

此篇为上一篇代码中遇到的一些函数的学习。

2022-08-15 15:32:59 330

原创 DCGAN

CNN在无监督学习方面受到的关注较少，作者希望通过此项工作弥合CNN在有监督与无监督学习方面的成功。作者提出了DCGAN的结构并证明了其是无监督学习的有力候选工具。通过对各种图像数据集的训练以及检验，证明了DCGAN中的生成器（G）与判别器（D）可以学习到从对象部分到场景的表示层次。此外，作者将学习到的特征用于新任务，证明了其作为一般图像表示的适用性。...

2022-08-15 11:02:01 944

本章我们将用一个神经网络来近似策略函数，这个神经网络叫做policy network，用于控制agent的运动，我们将使用policy gradient算法来训练这个网络。用神经网络近似策略函数π（a|s）考虑离散动作空间，比如A = {左, 右, 上}。策略函数π定义为：策略函数π 的输入是状态s 和动作a，输出是一个0 到1 之间的概率值。举个例子，把马里奥游戏当前屏幕上的画面作为s，策略函数会输出每个动作的概率值：有了三个概率值，agent会进行一次随机抽样，得到动作a,但是动作“左”被抽到概率最大。

2022-06-15 21:18:10 1209 1

原创 gym库文档学习（二）

本文档概述了为创建新环境而设计的 Gym 中包含的创建新环境和相关有用的装饰器、实用程序和测试。您可以克隆 gym-examples 以使用此处提供的代码。建议使用虚拟环境：1 子类化gym.Env在学习如何创建自己的环境之前，您应该查看 Gym 的 API 文档。链接：https://blog.csdn.net/weixin_45985148/article/details/125015252https://blog.csdn.net/weixin_45985148/article/details

2022-05-28 15:56:58 2267

原创 gym库文档学习（一）

最近老板突然让我编写一个自定义的强化学习环境，一头雾水（烦），没办法，硬着头皮啃官方文档咯~第一节先学习常用的API：1 初始化环境在 Gym 中初始化环境非常简单，可以通过以下方式完成：import gymenv = gym.make('CartPole-v0')2 与环境交互Gym 实现了经典的“代理环境循环”：代理在环境中执行一些动作（通常通过将一些控制输入传递给环境，例如电机的扭矩输入）并观察环境状态如何变化。一种这样的动作-观察交换被称为时间步长。RL

2022-05-28 10:16:07 3586

原创 2 value-based 价值学习+DQN

value-based learning DQN

2022-05-27 20:13:32 592

原创 1 基础知识

1 概率论基础1.1 随机变量随机变量是一个不确定量，它的值取决于一个随机事件的结果。比如抛一枚硬币，正面朝上记为0，反面朝上记为1.抛硬币是个随机事件，其结果记为随机变量X。X有两种取值结果：0/1.抛硬币之前X是未知的且带有随机性。抛硬币之后，X便有了观测值，记作x(小写)。1.2 概率密度函数概率密度函数（PDF）描述一个连续概率分布——即变量的取值范围X 是个连续集合。正态分布是最常见的一种连续概率分布，随机变量X 的取值范围是所有实数R。正态分布的概率密度函数是：

2022-05-26 16:54:32 2185

原创从强化学习的角度看alphago与MCTS

AlphaGo简单原理

2022-05-26 09:49:49 1353

原创第8章使用卷积进行泛化（3）

练习+之前出现的一些函数介绍

2022-05-15 10:50:35 451

原创第8章使用卷积进行泛化（2）

这一部分主要是添加卷积等操作后模型的训练以及练习题第一题1 组装完整的训练循环convnet的核心是两个循环的嵌套：外部循环是迭代周期，内部循环是DataLoader批次生成数据集。每个循环中都包含：通过模型提供输入（正向传播）计算损失（正向传播的一部分）将任何老的梯度归零调用loss.backward()来计算损失相对所有参数的梯度（反向传播）调节优化器1.1 组装并训练##训练循环...

2022-05-14 16:13:26 622 1

原创第8章使用卷积进行泛化（1）

本章主要内容1、理解什么是卷积2、构建卷积神经网络3、构建自定义的nn.Module的子类4、模块和函数API之间的区别5、神经网络的设计选择1 使用卷积进行泛化torch.nn模块提供一维、二维、三维的卷积nn.Conv1d用于时间序列nn.Conv2d用于图像nn.Conv3d用于体数据、视频1.1 加载数据%matplotlib inlineimport torchimport numpy as npfrom matplotlib impor

2022-05-14 11:56:10 956

原创 CNN中卷积核大小、池化以及padding对输入图像大小的影响

我们发现在不使用padding操作时，经过卷积操作后，输出图像比输入图像小一点。为保证输出图像的大小不变，我们可以使用padding操作：conv1 = nn.Conv2d(3, 16, kernel_size=3, padding=1)pool1 = nn.MaxPool2d(2)conv2 = nn.Conv2d(16, 8, kernel_size=3, padding=1)pool2 = nn.MaxPool2d(2)output1 = conv1(img.unsqueeze(

2022-05-14 11:51:14 6166

原创第七章区分鸟和飞机

本章主要内容：1、构建前馈神经网络2、使用Dataset和DataLoader加载数据3、了解分类损失1.cifar10数据集1.1 数据集下载###Cifar10数据集##下载数据集from torchvision import datasetsdata_path = 'D:\\DeepLearning data\\data\\p1ch7'cifar10 = datasets.CIFAR10(data_path, train=True, download=True)ci

2022-05-12 15:44:50 876

原创第六章使用神经网络拟合数据

本章主要内容1、神经网络与线性模型相比，非线性激活函数是主要的差异。2、使用pytorch的nn模块。3、用神经网络求解线性拟合问题。1.激活函数##一些激活函数import mathprint(math.tanh(-2.2))print(math.tanh(0.1))print(math.tanh(2.5))输出：2.pytorch nn模块pytorch提供的所有nn.Moudle的子类都定义了它们的__call__（）方法，这允许我们实例化一个nn.Lin

2022-05-11 20:31:12 2740

原创第五章学习的机制练习题

练习题目：将模型重新定义为 w2*t_u**2 + w1*t_u + b 评估改进后的效果。###创建模型def model(t_u, w1, w2, b): return w2*t_u**2 + w1*t_u + b###定义损失函数def loss_fn(t_p, t_c): squared_diffs = (t_p - t_c)**2 return squared_diffs.mean()##训练、验证与过拟合#分割数据集获取索引张量n_samples = t

2022-05-10 15:23:19 314

原创第五章学习的机制（1）

本章主要内容：1、理解算法如何从数据中学习2、使用微分与梯度下降法，将学习重构为参数估计3、了解一个简单学习算法4、了解pytorch如何支持自动求导1.温度计模型1.1 收集数据并进行可视化###温度计实例###1、获取数据集import torchimport matplotlib.pyplot as pltt_c = [0.5, 14.0, 15.0, 28.0, 11.0, 8.0, 3.0, -4.0, 6.0, 13.0, 21.0]t_u = [

2022-05-10 14:46:41 581

原创第四章使用张量表征真实数据（2）

续上篇1.处理时间序列数据集：华盛顿特区的自行车共享系统数据集目标：将一个平面的二维数据集转换为三维数据集1.1 增加时间维度+按时间段调整数据##处理时间序列将一个每一行都是单独时间数据的源数据改变其数据组织方式bikes_numpy = np.loadtxt( 'D:\\DeepLearning data\\data\\p1ch4\\bike-sharing-dataset\\hour-fixed.csv', dtype

2022-05-09 19:42:35 800

原创第四章使用张量表征真实数据（1）

原创第三章从张量开始+练习

主要涉及一些张量的基本操作：前一部分以截图形式展示吧#####numpy互操作 tensor-->arraypoints = torch.ones(3,4)points_np = points.numpy()print(type(points_np))####array-->tensorpoints = torch.from_numpy(points_np)print(typ...

2022-05-06 21:20:37 417

原创第二章预训练网络（2）+ 作业

前一章我们介绍了经典的Resnet并使用它对狗子的图片进行了预测。第二部分主要是CycleGAN将马的图片转变为斑马的实现。后续的NeuralTalk2模型等有时间再介绍~2.1 CycleRAN实现马——>斑马话不多说直接上代码：import torchimport torch.nn as nnclass ResNetBlock(nn.Module): def __init__(self, dim): super(ResNetBlock, self

2022-05-05 21:58:07 1041 2

原创第二章预训练网络（1）

本章的主要内容包括：1.运行预先训练好的图像识别模型。（本文介绍）2.简要介绍生成式对抗网络（GAN）和循环生成式对抗网络（CycleGAN）。3.可以为图像生成文本描述的字幕模型。4. 通过Torch Hub分享模型。2.1 一个识别图像主体的预训练网络2.1.1 获取一个预先训练好的网络用于图像识别我们可以从torchvision.models中找到预定义的模型：from torchvision import models查看实际模型：dir(models)

2022-05-05 20:59:33 913 5

原创第一章深度学习与PyTorch库简介

本书第一章主要介绍了深度学习的背景和PyTorch的基本库。没有涉及很多代码，这里简要总结本章内容，并查看PyTorch版本以及配置。

2022-05-05 16:37:20 410 1

原创 B站刘二大人深度学习 pytorch 第十三讲代码

用RNN实现输入name 系统识别country （CPU版本因此GPU的一些语句省略了~）1.导入所需包import torchimport numpy as npimport matplotlib.pyplot as pltfrom torch.utils.data import DataLoaderfrom torch.utils.data import Datasetfrom torchvision import transformsfrom torchvision imp

2022-04-27 22:52:14 363

原创 B站刘二中深度学习pytorch RNN(基础篇)所有代码

1.RNNcell设计init中：cell = torch.nn.RNNCell(inpt_size=input_size, hidden_size=hidden_size)forward中： hidden = cell(input,hidden)注意：维度是RNN中十分复杂的问题RNNcell设计中：input维度（batchsize，inputsize）hidden维度（batch，hiddensize） output维...

2022-04-27 17:21:21 2259

原创 B站刘二大人up主pytorch教程P7代码+tips

1.读取数据的问题说明请注意：up主的diabetes.csv.gz是自己创建的，他把x,y合并到了一个文件之中，且x的形状为（759,8）而如果我们用sklearn文件夹下的两个文件分别读取，不仅会产生报错（下图所示），而且x的大小还和视频中的不一致。#####sklearn文件夹下数据import torchimport numpy as npimport matplotlib.pyplot as pltx = np.loadtxt('diabetes_data.csv.gz',

2022-04-25 16:59:53 2169 10

原创强化学习A2C代码‘No module named ‘multiprocessing_env’错误解决

最近在学习强化学习关于A2C代码的过程中，遇到了如题‘No module named ‘multiprocessing_env’的错误使用pip 指令显示error：命令conda install -c auto multiprocessing同样不起作用解决：在自己工作目录中加入multiprocessing_env.py文件再导入问题得以解决py文件如下：import numpy as npfrom multiprocessing import Process, Pipe

2022-04-12 22:35:08 2005

原创吴恩达深度学习课后作业course2第三周超参数调试、Batch正则化和程序框架

版本说明tensorflow 1.8.0python 3.6.2conda 3.10.5h5py 2.10.0keras 2.1.6numpy 1.19.3 !!!1.19.4可能会报错！pandas 0.25.3

2022-03-24 15:38:58 2864

小柴不会敲代码

原创第四章对象和类（1）

原创 A2C算法原理及代码实现