刘狍狍同学-CSDN博客

原创强化学习（第三周）

强化学习1、什么是强化学习强化学习是机器学习的一个重要分支，是多学科多领域交叉的一个产物，它的本质是解决 decision making 问题，即自动进行决策，并且可以做连续决策。它主要包含四个元素，agent，环境状态，行动，奖励, 强化学习的目标就是获得最多的累计奖励。类比强化学习和动物学习训练幼犬的过程有两个要素：饲养员需要对幼犬发出指令，比如让它“坐着”，饲...

2019-06-28 13:32:51 150

在传统的强化学习任务中，通常通过计算累积奖赏来学习最优策略（policy），这种方式简单直接，而且在可以获得较多训练数据的情况下有较好的表现。然而在多步决策（sequential decision）中，学习器不能频繁地得到奖励，且这种基于累积奖赏及学习方式存在非常巨大的搜索空间。而模仿学习（Imitation Learning）的方法经过多年的发展，已经能够很好地解决多步决策问题，在机器人、 NL...

2019-06-28 13:32:32 210

原创管道堵塞识别与预警论文笔记

**《膏体输送管道压力监测研究》**针对膏体充填开采中易出现输送管道堵塞、压力失稳等问题，提出了 1861 工作面采空区膏体充填管道压力实时在线监测系统的技术方案，并对此进行了详细研究。论文中是采用...

2019-06-28 13:31:15 291

原创模仿学习（第四周）

在传统的强化学习任务中，通常通过计算累积奖赏来学习最优策略（policy），这种方式简单直接，而且在可以获得较多训练数据的情况下有较好的表现。然而在多步决策（sequential decision）中，学习器不能频繁地得到奖励，且这种基于累积奖赏及学习方式存在非常巨大的搜索空间。而模仿学习（Imitation Learning）的方法经过多年的发展，已经能够很好地解决多步决策问题，在机器人、 NL...

2018-09-01 21:17:22 1566

原创强化学习（第三周）

强化学习1、什么是强化学习强化学习是机器学习的一个重要分支，是多学科多领域交叉的一个产物，它的本质是解决 decision making 问题，即自动进行决策，并且可以做连续决策。它主要包含四个元素，agent，环境状态，行动，奖励, 强化学习的目标就是获得最多的累计奖励。类比强化学习和动物学习训练幼犬的过程有两个要素：饲养员需要对幼犬发出指令，比如让它“坐着”，饲...

2018-08-25 21:31:46 1404

原创 Django学习第二周

Django进阶学习回顾上一章改变模型需要这三步：编辑 models.py 文件，改变模型。运行 python manage.py makemigrations 为模型的改变生成迁移文件。运行 python manage.py migrate 来应用数据库迁移。创建超级用户并添加标题/内容/时间：python manage.py createsuperuserc...

2018-08-18 21:20:53 129

原创 django学习（第一周）

Django 学习（第一周）django初体验django目前最流行的python web开发框架。负责处理大部分web开发底层细节。优点： - 快速开发：用python开发; 数据库ORM系统 - 大量内置应用：后台管理系统admin; 用户认证系统auth; 会话系统sessions - 安全性高：表单验证; SQL注入; 跨站点攻击 - 易于扩展...

2018-08-11 21:15:38 178

liuting483926的博客

原创强化学习（第三周）

原创模仿学习（第四周）

原创管道堵塞识别与预警论文笔记

原创模仿学习（第四周）

原创强化学习（第三周）

原创 Django学习第二周

原创 django学习（第一周）

ER图设计实例

空空如也