- 博客(9)
- 问答 (3)
- 收藏
- 关注
原创 白话文学强化学习-3
马尔可夫决策模型书接上回,上次说完了折扣率γ\gammaγ,最后的公式是Gt=Rt+1+γRt+2+γ2Rt+3+...+γn−1RnG_t=R_{t+1} + \gamma R_{t+2} + \gamma^2 R_{t+3} + ... + \gamma^{n-1}R_nGt=Rt+1+γRt+2+γ2Rt+3+...+γn−1Rn再整理下就是 Gt=∑k=1nγk−1RkG...
2018-11-21 15:37:29 306
原创 白话文学强化学习-2
折扣率γ\gammaγ书接上回,我们上次说到强化学习模型中最重要的SAR,今天我们要引入一个新的参数γ\gammaγ gamma 又叫discount,中文翻译折扣率。之前说到强化学习的过程是由一个个SAR序列组成的,而强化学习的目标则是最大化R的总和也就是Total Reward=R1 + R2 + R3 + … + Rn但是Agent(就是我们训练的智能体也可以叫玩家)他每次其实比较关...
2018-11-20 22:09:23 269
原创 白话文学强化学习-1
强化学习介绍强化学习(reinforcement learning),又称再励学习、评价学习,是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有许多应用。强化学习用人话来解释的话,假设CV(计算机视觉)和NLP(自然语言处理)是教会计算机如何看和听这个世界的话,那RL(强化学习)则是教会计算机如何思考这个世界了。这里要拿出被举的最多的例子了:巴甫洛夫的狗强化学习的过程和训狗很像...
2018-11-16 22:46:20 595
原创 白话文学强化学习-0
白话文学强化学习-0 由于本人也还只是菜鸟,希望大佬轻喷~老古话说的好,温故而知新,决定把之前所学的感想记录下来,便于之后的复习浏览。由于本人语文不行,加之机器学习领域专业术语太多,所以想到用大家都比较能懂的通俗的语言去解释下强化学习这个机器学习的子领域也是本人最喜欢最关注任务今后最有前途的学科~...
2018-11-16 21:58:02 657
原创 源码解析关于java阻塞容器:ArrayBlockingQueue,LinkedBlockingQueue等
Java的阻塞容器介绍先来看看阻塞容器和其他容器之间的层级关系Collection AbstractCollectionQueue BlockingQueueAbstractQueue ArrayBlockingQueueLinkedBlockingQueueSynchronousQueuePriorityBlockingQueue我们就挑这四个重要的实现类来讲解。
2017-04-04 21:34:39 866
原创 java集合源码解析(三)--List
今天给大家带来有序集合的接口List,我想也应该是大家在工作中用的比较多的先来看看接口的定义:public interface List extends Collection可以看出接口List直接继承于接口Collection,并且一样使用了泛型下面我们再来看看List和Collection两个接口之间到底有哪些方法是一样的或是不一样的?通过比较两接口的方法,我看到除了Colle
2016-08-02 21:00:34 312
原创 java集合源码解析(二)--AbstractCollection
今天带来的是java单列顶层接口的第一个轻量级实现:AbstractCollection我们直接进入正题,先来看看它的声明:package java.util;//可以从名字上同样看到 AbstractCollection 是一个抽象类,所以并不能实例化,//这个类只是作为轻量级实现存在,让实现Collection的子类不需要实现太多的方法public abstract cla
2016-07-30 06:14:52 446
原创 java 集合类 底层源码解析,慢速更新~偏新手
我决定从java底层源码开始自己的博客之旅,水平有限,很有可能写的不对,欢迎大家指出缺点~博客慢速保持更新!先从java最常用的集合类开始更新吧~ java的集合类均来自于 java.util包下java单列顶层接口 Collection 先看看该接口的定义:public interface Collection extends Iterable 可以看出顶级接口Collect
2016-07-29 17:03:35 1146
空空如也
求助,C#如何将Excel中的表格 原样复制至PPT中
2016-10-01
求大神解释,我实在搞不懂
2016-07-28
Help!python pycharm 导入urllib.request 时的问题
2016-07-27
TA创建的收藏夹 TA关注的收藏夹
TA关注的人