自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 第四章 对象和类(1)

java核心技术学习

2022-10-04 15:14:45 216 1

原创 A2C算法原理及代码实现

A2C算法原理及代码实现

2022-10-02 15:57:11 11789 4

原创 gym库中core.py代码解读

gym项目文件中的core.py文件

2022-08-29 16:40:17 3177 1

原创 DCGAN(2)代码阅读

此篇为上一篇代码中遇到的一些函数的学习。

2022-08-15 15:32:59 245

原创 DCGAN

CNN在无监督学习方面受到的关注较少,作者希望通过此项工作弥合CNN在有监督与无监督学习方面的成功。作者提出了DCGAN的结构并证明了其是无监督学习的有力候选工具。通过对各种图像数据集的训练以及检验,证明了DCGAN中的生成器(G)与判别器(D)可以学习到从对象部分到场景的表示层次。此外,作者将学习到的特征用于新任务,证明了其作为一般图像表示的适用性。...

2022-08-15 11:02:01 863

原创 GAN(1)

GAN入门理论基础+代码

2022-08-11 15:08:34 580

原创 3 策略学习

本章我们将用一个神经网络来近似策略函数,这个神经网络叫做policy network,用于控制agent的运动,我们将使用policy gradient算法来训练这个网络。用神经网络近似策略函数π(a|s)考虑离散动作空间,比如A = {左, 右, 上}。策略函数π定义为:策略函数π 的输入是状态s 和动作a,输出是一个0 到1 之间的概率值。举个例子,把马里奥游戏当前屏幕上的画面作为s,策略函数会输出每个动作的概率值:有了三个概率值,agent会进行一次随机抽样,得到动作a,但是动作“左”被抽到概率最大。

2022-06-15 21:18:10 1044 1

原创 gym库文档学习(二)

本文档概述了为创建新环境而设计的 Gym 中包含的创建新环境和相关有用的装饰器、实用程序和测试。您可以克隆 gym-examples 以使用此处提供的代码。建议使用虚拟环境:1 子类化gym.Env在学习如何创建自己的环境之前,您应该查看 Gym 的 API 文档。链接:https://blog.csdn.net/weixin_45985148/article/details/125015252https://blog.csdn.net/weixin_45985148/article/details

2022-05-28 15:56:58 1850

原创 gym库文档学习(一)

最近老板突然让我编写一个自定义的强化学习环境,一头雾水(烦),没办法,硬着头皮啃官方文档咯~第一节先学习常用的API:1 初始化环境在 Gym 中初始化环境非常简单,可以通过以下方式完成:import gymenv = gym.make('CartPole-v0')2 与环境交互Gym 实现了经典的“代理环境循环”:代理在环境中执行一些动作(通常通过将一些控制输入传递给环境,例如电机的扭矩输入)并观察环境状态如何变化。一种这样的动作-观察交换被称为时间步长。RL

2022-05-28 10:16:07 3129

原创 2 value-based 价值学习+DQN

value-based learning DQN

2022-05-27 20:13:32 507

原创 1 基础知识

1 概率论基础1.1 随机变量随机变量是一个不确定量,它的值取决于一个随机事件的结果。比如抛一枚硬币,正面朝上记为0,反面朝上记为1.抛硬币是个随机事件,其结果记为随机变量X。X有两种取值结果:0/1.抛硬币之前X是未知的且带有随机性。抛硬币之后,X便有了观测值,记作x(小写)。1.2 概率密度函数概率密度函数(PDF)描述一个连续概率分布——即变量的取值范围X 是个连续集合。正态分布是最常见的一种连续概率分布,随机变量X 的取值范围是所有实数R。正态分布的概率密度函数是:

2022-05-26 16:54:32 1984

原创 从强化学习的角度看alphago与MCTS

AlphaGo简单原理

2022-05-26 09:49:49 920

原创 第8章 使用卷积进行泛化(3)

练习+之前出现的一些函数介绍

2022-05-15 10:50:35 391

原创 第8章 使用卷积进行泛化(2)

这一部分主要是添加卷积等操作后模型的训练以及练习题第一题1 组装完整的训练循环convnet的核心是两个循环的嵌套:外部循环是迭代周期,内部循环是DataLoader批次生成数据集。每个循环中都包含:通过模型提供输入(正向传播)计算损失(正向传播的一部分)将任何老的梯度归零调用loss.backward()来计算损失相对所有参数的梯度(反向传播)调节优化器1.1 组装并训练##训练循环...

2022-05-14 16:13:26 538 1

原创 第8章 使用卷积进行泛化(1)

本章主要内容1、理解什么是卷积2、构建卷积神经网络3、构建自定义的nn.Module的子类4、模块和函数API之间的区别5、神经网络的设计选择1 使用卷积进行泛化torch.nn模块提供一维、二维、三维的卷积nn.Conv1d用于时间序列nn.Conv2d用于图像nn.Conv3d用于体数据、视频1.1 加载数据%matplotlib inlineimport torchimport numpy as npfrom matplotlib impor

2022-05-14 11:56:10 864

原创 CNN中卷积核大小、池化以及padding对输入图像大小的影响

我们发现在不使用padding操作时,经过卷积操作后,输出图像比输入图像小一点。为保证输出图像的大小不变,我们可以使用padding操作:conv1 = nn.Conv2d(3, 16, kernel_size=3, padding=1)pool1 = nn.MaxPool2d(2)conv2 = nn.Conv2d(16, 8, kernel_size=3, padding=1)pool2 = nn.MaxPool2d(2)output1 = conv1(img.unsqueeze(

2022-05-14 11:51:14 5613

原创 第七章 区分鸟和飞机

本章主要内容:1、构建前馈神经网络2、使用Dataset和DataLoader加载数据3、了解分类损失1.cifar10数据集1.1 数据集下载###Cifar10数据集##下载数据集from torchvision import datasetsdata_path = 'D:\\DeepLearning data\\data\\p1ch7'cifar10 = datasets.CIFAR10(data_path, train=True, download=True)ci

2022-05-12 15:44:50 768

原创 第六章 使用神经网络拟合数据

本章主要内容1、神经网络与线性模型相比,非线性激活函数是主要的差异。2、使用pytorch的nn模块。3、用神经网络求解线性拟合问题。1.激活函数##一些激活函数import mathprint(math.tanh(-2.2))print(math.tanh(0.1))print(math.tanh(2.5))输出:2.pytorch nn模块pytorch提供的所有nn.Moudle的子类都定义了它们的__call__()方法,这允许我们实例化一个nn.Lin

2022-05-11 20:31:12 2480

原创 第五章 学习的机制 练习题

练习题目:将模型重新定义为 w2*t_u**2 + w1*t_u + b 评估改进后的效果。###创建模型def model(t_u, w1, w2, b): return w2*t_u**2 + w1*t_u + b###定义损失函数def loss_fn(t_p, t_c): squared_diffs = (t_p - t_c)**2 return squared_diffs.mean()##训练、验证与过拟合#分割数据集获取索引张量n_samples = t

2022-05-10 15:23:19 217

原创 第五章 学习的机制(1)

本章主要内容:1、理解算法如何从数据中学习2、使用微分与梯度下降法,将学习重构为参数估计3、了解一个简单学习算法4、了解pytorch如何支持自动求导1.温度计模型1.1 收集数据并进行可视化###温度计实例###1、获取数据集import torchimport matplotlib.pyplot as pltt_c = [0.5, 14.0, 15.0, 28.0, 11.0, 8.0, 3.0, -4.0, 6.0, 13.0, 21.0]t_u = [

2022-05-10 14:46:41 509

原创 第四章 使用张量表征真实数据(2)

续上篇1.处理时间序列数据集:华盛顿特区的自行车共享系统数据集目标:将一个平面的二维数据集转换为三维数据集1.1 增加时间维度+按时间段调整数据##处理时间序列 将一个每一行都是单独时间数据的源数据改变其数据组织方式bikes_numpy = np.loadtxt( 'D:\\DeepLearning data\\data\\p1ch4\\bike-sharing-dataset\\hour-fixed.csv', dtype

2022-05-09 19:42:35 695

原创 第四章 使用张量表征真实数据(1)

最近高产似那啥~

2022-05-07 22:53:43 451

原创 第三章 从张量开始+练习

主要涉及一些张量的基本操作:前一部分以截图形式展示吧#####numpy互操作 tensor-->arraypoints = torch.ones(3,4)points_np = points.numpy()print(type(points_np))####array-->tensorpoints = torch.from_numpy(points_np)print(typ...

2022-05-06 21:20:37 337

原创 第二章 预训练网络(2)+ 作业

前一章我们介绍了经典的Resnet并使用它对狗子的图片进行了预测。第二部分主要是CycleGAN将马的图片转变为斑马的实现。后续的NeuralTalk2模型等有时间再介绍~2.1 CycleRAN实现马——>斑马话不多说直接上代码:import torchimport torch.nn as nnclass ResNetBlock(nn.Module): def __init__(self, dim): super(ResNetBlock, self

2022-05-05 21:58:07 859 2

原创 第二章 预训练网络(1)

本章的主要内容包括:1.运行预先训练好的图像识别模型。(本文介绍)2.简要介绍生成式对抗网络(GAN)和循环生成式对抗网络(CycleGAN)。3.可以为图像生成文本描述的字幕模型。4. 通过Torch Hub分享模型。2.1 一个识别图像主体的预训练网络2.1.1 获取一个预先训练好的网络用于图像识别我们可以从torchvision.models中找到预定义的模型:from torchvision import models查看实际模型:dir(models)

2022-05-05 20:59:33 806 5

原创 第一章 深度学习与PyTorch库简介

本书第一章主要介绍了深度学习的背景和PyTorch的基本库。没有涉及很多代码,这里简要总结本章内容,并查看PyTorch版本以及配置。

2022-05-05 16:37:20 337 1

原创 B站 刘二大人 深度学习 pytorch 第十三讲代码

用RNN实现 输入name 系统识别country (CPU版本 因此GPU的一些语句省略了~)1.导入所需包import torchimport numpy as npimport matplotlib.pyplot as pltfrom torch.utils.data import DataLoaderfrom torch.utils.data import Datasetfrom torchvision import transformsfrom torchvision imp

2022-04-27 22:52:14 310

原创 B站 刘二中 深度学习pytorch RNN(基础篇)所有代码

1.RNNcell设计init中:cell = torch.nn.RNNCell(inpt_size=input_size, hidden_size=hidden_size)forward中: hidden = cell(input,hidden)注意:维度是RNN中十分复杂的问题RNNcell设计中:input维度(batchsize,inputsize)hidden维度(batch,hiddensize) output维...

2022-04-27 17:21:21 2166

原创 B站刘二大人up主pytorch教程P7代码+tips

1.读取数据的问题说明请注意:up主的diabetes.csv.gz是自己创建的,他把x,y合并到了一个文件之中,且x的形状为(759,8)而如果我们用sklearn文件夹下的两个文件分别读取,不仅会产生报错(下图所示),而且x的大小还和视频中的不一致。#####sklearn文件夹下数据import torchimport numpy as npimport matplotlib.pyplot as pltx = np.loadtxt('diabetes_data.csv.gz',

2022-04-25 16:59:53 1755 9

原创 强化学习A2C代码‘No module named ‘multiprocessing_env’错误解决

最近在学习强化学习关于A2C代码的过程中,遇到了如题‘No module named ‘multiprocessing_env’的错误使用pip 指令显示error:命令conda install -c auto multiprocessing同样不起作用解决:在自己工作目录中加入multiprocessing_env.py文件再导入 问题得以解决py文件如下:import numpy as npfrom multiprocessing import Process, Pipe

2022-04-12 22:35:08 1772

原创 吴恩达深度学习课后作业course2第三周 超参数调试、Batch正则化和程序框架

版本说明tensorflow 1.8.0python 3.6.2conda 3.10.5h5py 2.10.0keras 2.1.6numpy 1.19.3 !!!1.19.4可能会报错!pandas 0.25.3

2022-03-24 15:38:58 2769

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除