- 博客(89)
- 资源 (6)
- 收藏
- 关注
原创 TFLearn之RNN
引子     &a
2018-05-23 10:42:30 1256
原创 关于tf.distributions的那些事儿
引子       在学习各类Machine Learning方法时,免不了要与“分布”打交道。我们有时候需要计算某个分布的熵,有时候需要计算两个分布之间的交叉熵或KL散度。当然,这可以通过使用Numpy中的numpy.random.normal之类的函数来实现,但是我们更希望能够按照TensorFlow计算图的形式来实现,这
2018-10-26 09:56:03 9304 1
原创 关于rand()和srand()
引子 相信大家对于rand()函数并不陌生,我们常用它来生成伪随机数,但是为什么有时候我们生成的随机数并不符合预期呢?或者说,为什么有时候我们生成的随机数并不随机?如何有效地生成伪随机数呢?rand()
2018-09-04 11:30:39 65260 18
原创 关于VC维的理解
简介        VC维,全称为Vapnik-Chervonenkis Dimension,它反映了模型的学习能力,VC维越大,则模型的容量越大。通俗定义  
2018-06-27 21:16:06 21617 6
原创 关于rospy中图像的实时处理
引子        前一段时间做项目时遇到了一个图像处理的问题,当时的任务是要在ROS中实时地获取图像并作为网络的输入进行前向计算。如果是使用C++的话将没有什么问题,直接获取图像处理就是了,但是如果使用Python的话,就会遇到数据格式的问题。下面我们对此进行简要介绍。rosmsg中的数据格式
2018-06-26 17:31:06 1425
原创 Keras/TFLearn 之 Time Distributed
引子 前段时间写过一篇有关于TFLearn中time_distributed()函数的博客,在这篇博客中,我们提到过这个函数并不能那么直接地实现参数共享。最近看Keras的时候,发现Keras的TimeDistributed() Wrapper却是默认参数共享的。TFLearn ...
2018-06-12 11:35:56 3759
原创 实时绘制机械臂关节速度
引子        我们在做机器人实验的时候,一般需要实时地观察机械臂的各个状态信息,所以动态绘图是不可避免
2018-06-01 11:39:49 4907 2
原创 ROS中getCurrentPose()函数调用时间过长问题的解决方法
引子       &a
2018-05-30 11:42:56 2601 3
原创 TensorFlow之name_scope/variable_scope
引子        前面写过一篇博文《TensorFlow学习笔记(六)》,其内容主要介绍的就是name_scope/variable_scope的使用,不过并没有明确地对
2018-05-26 09:29:44 480
原创 TFLearn之Time Distributed
引子   &a
2018-05-24 12:00:46 6134 6
原创 Linux中的帮助文档
大小写 在Linux环境中,大小写是不一样的东西,date–>ok,Date–>未找到命令,DATE–>未找到命令; 但是,在MacOS下,默认是
2018-05-19 18:14:03 2259
原创 C++中的特殊注释
引子 我们知道,在C++中常用“//”进行单行注释,用“/**/”进行多行注释,那什么是特殊注释?介绍 特殊注释是一些通用的,能够被编译器识别的特殊字符。比如说,我们常用的特殊注释有“
2018-05-19 14:03:05 1206
原创 Python语法糖之@property
引子 今天阅读OpenAI Gym的robotics/robot_env.py时,遇到了@property这个语法糖,因此记录一下,以备下次使用。简介 我们知道,在Python中,
2018-04-26 10:34:31 1325
原创 关于Tensorflow与Gym MuJoCo同时使用的问题
引子 大家好,今天我们稍微介绍一下如何处理TensorFlow与Gym MuJoCo同时使用将会出错的问题。问题 在同时使用TensorFlow-GPU和Gym MuJoCo时,可
2018-04-25 15:47:32 1393
原创 Miniconda + OpenAI Gym + MuJoCo + Tensorflow-gpu
引子 大家好,最近因为实验需要,得搭好一个机械臂的强化学习仿真环境。在去年我基于Ros + Gazebo搭过一个baxter机器人的强化学习环境,但是为了能够与别人的baseline进行对比,所以现在我准备使用OpenAI Gym新发布的Fetch机械臂环境。环境配置  ...
2018-04-20 19:33:36 3882 12
原创 《Selective Experience Replay for Lifelong Learning》与水塘抽样
引子 最近在调研论文,这个过程中我常常能学到一些好东西,比如本文要聊到的水塘抽样(reservoir sampling)。 先大致说明一下论文要解决的问题以及想法。 &nbs
2018-04-01 17:47:40 997
原创 Python对象序列化
引言 我们知道在Python中,一切皆为对象,实例是对象,类是对象,元类也是对象。本文正是要聊聊如何将这些对象有效地保存起来,以供后续使用。pickle与cPickle pickl
2018-03-22 11:23:21 6181
原创 numpy.newaxis的使用
作用 numpy.newaxis从字面上来理解就是用来创建新轴的,或者说是用来对array进行维度扩展的。举例>>> import numpy as np>>> x = np.array([1, 2, 3, 4])>>
2018-03-21 01:03:53 11000 1
原创 关于Python中*与**的区别与使用
(*)与(**)的区别 一个星(*)表示将参数作为元组来处理;两个星(**)表示将参数作为字典来处理。实例a)在函数参数列表中使用 在函数参数列表中使用*或者**表示将调用时传
2018-03-19 13:01:59 2025
原创 说一说\r与\n
动机 今天在用Python读取txt文件的时候,遇到了一个比较坑的问题,那就是“\n”和“\r”究竟有什么区别?”历史 在计算机还没有出现之前,人们设计了一种机器叫做电传打字机,这种机
2018-03-18 21:53:46 13067
原创 Anaconda + TensorFlow
更新Anaconda 当我正兴致勃勃地输入:$ conda create -n tensorflow python=2.7 conda告诉我说,你需要更新conda啦~那更新就更新
2018-03-18 00:15:21 900
原创 浅说Anaconda
动机 在我对MacOS进行更新之后,我的TensorFlow不能用了。整了半天,感觉自己把电脑整得很乱了,于是我想到了备受夸赞的Anaconda。安装与卸载 我是在MacOS Si
2018-03-17 19:30:32 1126
原创 关于tf.stop_gradient的使用及理解
        写这篇文章的原因是今天有人问我,DQN中为什么要对q_target进行stop_gradient啊?    &a
2018-03-17 10:42:00 44066 10
原创 k近邻法的实现:kd树
k近邻法(k-NN) k近邻法并没有显式的训练过程,对于某个新的实例,根据其k个最近邻的训练实例的类别,通过多数表决等方式进行预测。换句话说,其本质就是利用训练数据集对特征向量空间进行划分。 &nbs
2018-03-16 17:31:47 312
原创 LeetCode(12):longest-consecutive-sequence
题目描述 Given an unsorted array of integers, find the length of the longest consecutive elements sequence. For example, Given [100, 4, 200, 1, 3, 2], The...
2018-03-15 21:59:08 265
原创 关于Novikoff定理与感知机算法的收敛性
感知机模型 感知机是一种二类分类的线性模型,它是由误分类驱动的,属于判别模型。说白了,它的实质就是输入空间或特征空间中的一个分离超平面。 《统计学习方法》中的定义: 学习策略 &n
2018-03-15 12:18:18 4279 6
原创 Ubuntu14.04 + Python3.4.3 + OpenCV3.1.0的安装配置
本文主要介绍在配置OpenCV3.1.0中的几个坑。如何设置cmake Python3 因为我没有使用Anaconda,所以,cmake将会检测到两个版本的python,而cmake倾向于使用低版本的python,也就是会
2018-03-15 10:30:16 440
原创 关于baselines示例程序train_cartpole.py的ImportError
问题导出 为了更方便地实现自己的一些想法,我最终还是向OpenAI的baselines屈服了,因为自己的一些实现总是难与各大论文给出的结果进行对比。于是我今天安装了baselines,其中还是有一些坑的,这里主要介绍在安装完成之后,运行示例时cartpole.py所遇到的坑,它叫做ImportError。...
2018-03-14 11:41:24 1667
原创 LeetCode(11):single-number-ii
题目描述 Given an array of integers, every element appears three times except for one. Find that single one. Note: Your algorithm should have a linear runtime complexity. Could you implement i...
2018-03-13 17:34:32 187
原创 LeetCode(10):single-number
题目描述 Given an array of integers, every element appears twice except for one. Find that single one. Note: Your algorithm should have a linear runtime complexity. Could you implement it with...
2018-03-13 10:44:18 180
原创 关于Hoeffding不等式及泛化误差上界
在监督学习中,我们通常会定义一个目标函数来衡量模型的好坏,定义一个风险函数从而计算模型预测结果与真实值之间的误差是一种惯用手段。一般而言,我们将考虑训练集上的训练误差和测试集上的泛化误差,事实上,训练误差的持续降低并不是那么令人愉快,因为这可能是“过拟合”在背后操纵着一切。总的来说,只有泛化误差的降低才能真的让人感觉美滋滋。 如果给我们一个模型,我们该从什么方面去降低泛化...
2018-03-12 15:11:02 5910 6
原创 LeetCode(9):copy-list-with-random-pointer
题目描述 A linked list is given such that each node contains an additional random pointer which could point to any node in the list or null. Return a deep copy of the list.思考 本题在传统链表节点的结构体...
2018-03-11 13:03:20 183
原创 LeetCode(8):word-break
题目描述 Given a string s and a dictionary of words dict, determine if s can be segmented into a space-separated sequence of one or more dictionary words. For example, given s ="leetcode", dict...
2018-03-07 22:44:18 397
原创 Python每日小结(十三)之 unexpected indent
本文讲一下常见的IndentatinoError: unexpected indent。 在写代码时,尤其是在复制粘贴一段代码时,常常会遇到上面的这种错误,主要原因是原始代码用的缩进方式与我们后面修改时的缩进方式不一致造成的。这个时候一些可以查看缩进方式的编辑器就很有帮助了,比如Sublime Text: 仔细观察上面的图,最后一行前面先有几个小点,然后才是一段一段...
2018-03-05 19:27:40 1393
原创 LeetCode(7):linked-list-cycle-ii
题目描述 Given a linked list, return the node where the cycle begins. If there is no cycle, return null. Follow up: Can you solve this without using extra space?思考 在《LeetCode(6):linked-l...
2018-03-05 10:29:30 207
原创 LeetCode(6):linked-list-cycle
题目描述 Given a linked list, determine if it has a cycle in it. Follow up: Can you solve it without using extra space?思考 看到这道题的第一眼其实是有点懵的,怎么样知道一个链表是否有环呢?显然我们不能简单地用某个指针q遍历链表,然后看是不是有q->...
2018-03-05 01:22:07 169
原创 LeetCode(5):reorder-list
题目描述 Given a singly linked list L: L 0→L 1→…→L n-1→L n, reorder it to: L 0→L n →L 1→L n-1→L 2→L n-2→… You must do this in-place without altering the nodes' values. For example, Given...
2018-03-04 20:45:29 206
原创 LeetCode(4):binary-tree-preorder-traversal
题目描述 Given a binary tree, return the preorder traversal of its nodes' values.思考 昨天在《binary-tree-preorder-traversal》中我们讲到了二叉树的后根序遍历,其中我们聊了如何使用递归方法和非递归方法解题,这里的前根序遍历也有这两种解法。 递归:/** * Def...
2018-03-04 13:43:15 131
原创 LeetCode(3):binary-tree-postorder-traversal
题目描述 Given a binary tree, return the postorder traversal of its nodes' values.思考 本题考查的是对于后序遍历的理解。后序遍历,全称叫做“后根序遍历”,即先遍历左子树,再遍历右子树,最后遍历根节点的遍历方式。对于二叉树的遍历,很容易想到的解决方法是递归,当然,我们也可以考考自己,尝试着用迭代的方法实...
2018-03-03 11:14:13 534
原创 David Silver强化学习课程笔记(八)(下)
第八课(下):基于Simulation的搜索方法 在《第八课(上):学习与规划的结合》中,我们讲到了Model-Based RL方法,在该方法中,我们首先拟合得到一个模型,然后可以利用各种规划方法进行规划,或者,可以引申出Sample-Based Planning,也即我们并不是去采用贝尔曼方程计算,而是用模型进行采样,然后利用Model-Free方法进行学习。本文中要讲的Simul...
2018-03-02 22:59:23 1847
David Silver强化学习课程课件
2018-05-23
DQN实现的两种版本
2018-03-17
引导策略搜索介绍 - GPS
2017-11-24
Batch Normalization简介
2017-11-24
机器人中的强化学习技术
2017-11-24
贝叶斯线性回归 - Bayes
2017-11-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人