自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (1)
  • 收藏
  • 关注

原创 强化学习(第三周)

强化学习1、什么是强化学习强化学习是机器学习的一个重要分支,是多学科多领域交叉的一个产物,它的本质是解决 decision making 问题,即自动进行决策,并且可以做连续决策。它主要包含四个元素,agent,环境状态,行动,奖励, 强化学习的目标就是获得最多的累计奖励。类比强化学习和动物学习训练幼犬的过程有两个要素:饲养员需要对幼犬发出指令,比如让它“坐着”,饲...

2019-06-28 13:32:51 150

原创 模仿学习(第四周)

在传统的强化学习任务中,通常通过计算累积奖赏来学习最优策略(policy),这种方式简单直接,而且在可以获得较多训练数据的情况下有较好的表现。然而在多步决策(sequential decision)中,学习器不能频繁地得到奖励,且这种基于累积奖赏及学习方式存在非常巨大的搜索空间。而模仿学习(Imitation Learning)的方法经过多年的发展,已经能够很好地解决多步决策问题,在机器人、 NL...

2019-06-28 13:32:32 210

原创 管道堵塞识别与预警 论文笔记

**《膏体输送管道压力监测研究》**针对膏体充填开采中易出现输送管道堵塞、压力失稳等问题,提出了 1861 工作面采空区膏体充填管道压力实时在线监测系统的技术方案,并对此进行了详细研究。论文中是采用...

2019-06-28 13:31:15 291

原创 模仿学习(第四周)

在传统的强化学习任务中,通常通过计算累积奖赏来学习最优策略(policy),这种方式简单直接,而且在可以获得较多训练数据的情况下有较好的表现。然而在多步决策(sequential decision)中,学习器不能频繁地得到奖励,且这种基于累积奖赏及学习方式存在非常巨大的搜索空间。而模仿学习(Imitation Learning)的方法经过多年的发展,已经能够很好地解决多步决策问题,在机器人、 NL...

2018-09-01 21:17:22 1566

原创 强化学习(第三周)

强化学习1、什么是强化学习强化学习是机器学习的一个重要分支,是多学科多领域交叉的一个产物,它的本质是解决 decision making 问题,即自动进行决策,并且可以做连续决策。它主要包含四个元素,agent,环境状态,行动,奖励, 强化学习的目标就是获得最多的累计奖励。类比强化学习和动物学习训练幼犬的过程有两个要素:饲养员需要对幼犬发出指令,比如让它“坐着”,饲...

2018-08-25 21:31:46 1404

原创 Django学习第二周

Django进阶学习回顾上一章改变模型需要这三步: 编辑 models.py 文件,改变模型。 运行 python manage.py makemigrations 为模型的改变生成迁移文件。 运行 python manage.py migrate 来应用数据库迁移。创建超级用户并添加 标题/内容/时间:python manage.py createsuperuserc...

2018-08-18 21:20:53 129

原创 django学习(第一周)

Django 学习(第一周)django初体验django目前最流行的python web开发框架。负责处理大部分web开发底层细节。 优点: - 快速开发:用python开发; 数据库ORM系统 - 大量内置应用:后台管理系统admin; 用户认证系统auth; 会话系统sessions - 安全性高:表单验证; SQL注入; 跨站点攻击 - 易于扩展...

2018-08-11 21:15:38 178

ER图设计实例

工厂的E-R设计实例,包括说明文档和E-R图,以及powerdesign设计。

2018-12-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除