深度学习
文章平均质量分 73
深度学习算法和实践探索,ML框架学习。
星云
我们不只是代码的搬运工,我们还生产代码。
展开
-
PyTorch实现flappy bird游戏机器玩家
DuelingDQN也是一个比较容易实现的DQN变种,它和DQN的唯一差别,就是Network构造的不同。这种结构上的不同,可以让dueling DQN更快地学习到东西。在网络更新的时候,由于有A值之和必须为0的限制,所以网络会优先更新S值。S值是Q值的平均数,平均数的调整相当于一次性S下的所有Q值都更新一遍。如上图,橙色虚线是平均值,也就是S值。所以网络在更新的时候,不但更新某个动作的Q值,而是把这个状态下,所有动作的Q值都调整一次。在图上就相当于直接提着橙色虚线调整。这样,我们就可原创 2022-08-01 08:44:48 · 1668 阅读 · 9 评论 -
DQN伪代码
Q学习一种基于值的强化学习。function QLearning(θ\boldsymbol\thetaθ, A\mathcal AA, S全\mathcal S_全S全, mmm){ var QQQ = new arbitrarily; /* 随机选取mmm个状态 */ do{ var y\mathcal yy = new List(mmm); foreach(iii in S\mathcal SS.sample(mmm)){ var s\boldsymbol ss = Si\ma原创 2022-06-15 23:15:49 · 2221 阅读 · 1 评论 -
GoogLeNet基础结构
Inception模块基础结构GoogLeNet在ILSRVRC 2014比赛(千分类问题)夺冠,由多个Inception模块组成。看起来,Inception模块试图使通过使不同的卷积序列对同一组输入进行处理来得到更丰富的特征。在Inception模块中,输入接受并联的1×1、3×3、5×5 convolution和3×3 max pooling层的处理以生成输出。采用不同大小的卷积层意在更好地处理多个尺度的对象。事实上更宽的网络能使一些训练结果改善。GoogLeNet v1 结构layer原创 2021-06-16 20:56:09 · 136 阅读 · 0 评论 -
小白上手tensorflow helloworld
全宇宙最白的小白 上手tensorflow刚刚从菜鸟上看了python语法,用import < 包名模块名 >来导入模块,*就是包的模块全导入。tensorflow是啥是个python包。嗯,没毛病……导入……然后就不会了#!/usr/bin/env python# -*- coding: utf-8 -*-import tensorflow as tf不会没关系,代码打一半就会出现提示。不光有提示,还有示例。上手深度学习很多不免一篇茫然,tensorflow原创 2021-03-15 22:31:28 · 1059 阅读 · 3 评论 -
【Tensorflow快速上手】手写数字识别现成代码每行都有注释、自定义损失函数、自定义训练步骤train_step、早停预防过拟合
BP算法LeNet-5LeNet-5是最早的卷积神经网络之一,用作快速识别手写数字。论文提出的卷积层、池化层的概念,也提到MNIST数据集环境Cuda compilation tools, release 11.2, V11.2.152Build cuda_11.2.r11.2/compiler.29618528_0Python 3.8.10tensorflow-gpu 2.5.0MNIST数据集代码#!~/.conda/envs python# -*- coding: utf-.原创 2021-08-04 19:20:32 · 1199 阅读 · 1 评论 -
手动MNIST数据集
DOWNLOAD THE MNIST DATABASEMNIST数据集有60000个示例的训练集和10000个示例的测试集。它是NIST提供的更大集合的子集。数字已经过大小标准化,并在固定大小的图像中居中。它是一个很好的数据库,为那些想尝试学习技术和模式识别方法的人对现实世界的数据,同时花费最小的努力在预处理和格式化。# !/usr/bin/env python# -*- coding: utf-8 -*-import os, gzip, struct, PIL, numpyimport m原创 2021-07-21 21:47:00 · 322 阅读 · 0 评论 -
卷积神经网络和LeNet-5
卷积神经网络卷积神经网络(CNN)是一种深度学习算法,其仿照生物视觉机制来提取特征,卷积神经网络的隐层包含卷积层、池化层和全连接层。卷积层为了减少参数以防过拟合,卷积层中的神经元被分组,每组神经元共享权重并仅连接上层神经元中的一部分,也可以看成一个神经元以“扫描”的方式连接上层神经元(如下图),但这种扫描并不代表卷积层神经元与上层不同神经元的连接存在时间上的先后顺序。每组输出“图像”尺寸都与输入尺寸相同,输入和输出的“图像”数量往往不同,输出的“图像”数量取决于组数。下图中输入为X+\textbf{原创 2021-03-31 21:08:01 · 477 阅读 · 1 评论 -
DQN Pytorch示例
智能体是一个字母o,它卡在许多_之间,而要达到的目的是并确保o两侧都有_,这需要让o能够向左右两边移动,而且速度略快于无动作时的自然移动速度,看起来就像下面那样。这是一种很简单的情形。pytorch版本。............原创 2022-07-23 21:13:36 · 620 阅读 · 1 评论 -
PyTorch异或问题
实验环境CUDA版本:nvcc --versionnvcc: NVIDIA (R) Cuda compiler driverCopyright (c) 2005-2021 NVIDIA CorporationBuilt on Sun_Feb_14_21:12:58_PST_2021Cuda compilation tools, release 11.2, V11.2.152Build cuda_11.2.r11.2/compiler.29618528_0Python版本:python --ve原创 2020-11-29 22:24:31 · 243 阅读 · 1 评论