自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

深度强化学习(DeepRL)探索博客

研究领域:深度强化学习理论算法、理论优化、神经网络及博弈论

  • 博客(9)
  • 资源 (2)
  • 收藏
  • 关注

原创 深度强化学习系列(16): 从DPG到DDPG算法的原理讲解及tensorflow代码实现

Atari 游戏所需的动作是离散的,且属于低维(只有少数几个动作),但现实生活中很多问题都是连续的,且维度比较高,比如机器人控制(多个自由度)等。虽然可以对连续性高维度的动作做离散型的处理,但是对于一个经过离散处理的大状态空间,使用DQN训练仍然是仍然是一个比较棘手的问题,因为DQN算法的核心思想是利用随机策略进行探索,对于高维度的来说,第一个问题是:模型很难收敛,第二个问题是需要在探索和利用之间进行协调

2018-05-22 18:00:53 15767

原创 failed to create cublas handle: CUBLAS_STATUS_NOT_INITIALIZED

问题:2018-05-31 09:42:41.796259: E tensorflow/stream_executor/cuda/cuda_blas.cc:366] failed to create cublas handle: CUBLAS_STATUS_NOT_INITIALIZED2018-05-31 09:42:41.796310: W tensorflow/stream_exe...

2018-05-31 09:55:10 9408 1

原创 TensorFlow: InternalError: Blas SGEMM launch failed

问题描述: InternalError: Blas SGEMM launch failed : a.shape=(100, 784), b.shape=(784, 10), m=100, n=10, k=784 [[Node: MatMul = MatMul[T=DT_FLOAT, transpose_a=false, transpose_b=false, _device="/jo...

2018-05-30 11:27:56 8055

原创 Matplotlib中二维坐标点动态画图

#!/usr/bin/env python# -*- coding: utf-8 -*-# @File : plot.py# @Author: J.Q# @Date : 18-5-29# @Desc :#import numpy as npimport matplotlib.pyplot as pltfig = plt.figure(figsize=(4, 4))...

2018-05-29 21:52:11 4405 2

原创 深度学习之正则化系列(2):数据集增强(数据增广)

让机器学习模型泛化得更好的最好办法是使用更多的数据进行训练。当然,在实践中,我们拥有的数据量是很有限的。解决这个问题的一种方法是创建假数据并添加到训练集中。对于一些机器学习任务,创建新的假数据相当简单。对分类来说这种方法是最简单的。分类器需要一个复杂的高维输入 x,并用单个类别标识 y 概括 x。这意味着分类面临的一个主要任务是要对各种各样的变换保持不变。我们可以轻易通过转换训练集中的 x 来生成...

2018-05-24 17:30:35 5973

原创 深度学习之正则化系列(1):深入理解参数范数惩罚(L1正则化、L2正则化)原理及tensorflow实现

1、背景简介说起正则化,那为什么我们训练的模型或者是神经网络需要正则化呢?它的主要作用在于: 提高泛化能力,防止过拟合举个例子:上学期间广义分为三种人(仅仅说学习成绩): 学渣:根本就没学懂,书中的题目不会,考试卷也不会(欠拟合) 书呆子:就会课本上的,所有题目都会做,但是考试就是成绩低(过拟合) 学霸: 书中的会,考试照样考100,是不是可怕?懂了吧,机器学习和人一...

2018-05-23 11:31:45 15474 1

原创 SVM原理及在分类和回归预测中的python代码实现

注: 本blog是个人学习笔记记录,如有错误,欢迎指出,以供学习进步!,再次非常感谢!说起SVM,应该是机器学习中非常典型的算法,但理解也是比较难的,因此直接看博主july的《支持向量机通俗导论(理解SVM的三层境界)》https://www.cnblogs.com/v-July-v/archive/2012/06/01/2539022.html, 讲的非常全面和细致,看完之后基本上就理解...

2018-05-21 21:49:57 17748 1

原创 通俗直白讲解卷积神经网络(CNN),以及利用tensorflow+CNN实现手写数字(MNIST)分类的代码实现

注:假设已经懂了简单神经网络1. 卷积神经网络卷积神经网络(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网络由一个或多个卷积层和顶端的全连通层(对应经典的神经网络)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网络能够利...

2018-05-20 16:57:59 4115

原创 批量读取数据next_batch()的简单函数实现

读取方法过程Method()# 随机取batch_size个训练样本 import numpy as npdef next_batch(train_data, train_target, batch_size): index = [ i for i in range(0,len(train_target)) ] np.random.shuffle(index)...

2018-05-20 13:21:12 13106 9

机器学习实战与代码

机器学习实战书籍源代码,主要包括各个样例的具体python代码

2017-12-01

apache-tomcat-7.0.39.tar.gz

apache-tomcat-7.0.39.tar.gz for linux

2016-08-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除