自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (1)
  • 收藏
  • 关注

转载 在Linux 中 build 开源人脸识别引擎SeetaFace

一.安装OpenCV 依赖1. Require Packages[compiler] sudo apt-get install build-essential[required] sudo apt-get install cmake git libgtk2.0-dev pkg-config libavcodec-dev libavformat-dev libswscale-dev[

2017-07-28 19:30:31 863

转载 Boost.Asio入门

Boost.Asio入门首先,让我们先来了解一下什么是Boost.Asio?怎么编译它?了解的过程中我们会给出一些例子。然后在发现Boost.Asio不仅仅是一个网络库的同时你也会接触到Boost.Asio中最核心的类——io_service。什么是Boost.Asio简单来说,Boost.Asio是一个跨平台的、主要用于网络和其他一些底层输入/输出编程的C++库。计算机网络的设计

2017-07-22 11:34:39 1180

转载 业界 | OpenAI提出强化学习近端策略优化,可替代策略梯度法

选自OpenAI机器之心编辑部参与:蒋思源、Smith近日,OpenAI 发布了一种新型的强化学习算法,近端策略优化(Proximal Policy Optimization/PPO)算法,该算法的实现和调参十分简单,并且它的性能甚至要超过现阶段最优秀的方法。因为该算法实现非常简单并且有优秀的性能,PPO 已经成为了 OpenAI 默认使用的强化学习算法。

2017-07-21 13:28:32 3105

转载 dnsmasq使用注意事项

DNS服务器,linux下一般用bind,但bind太复杂了,dnsmasq使用上比dns始祖bind要简便得多,可以做正向dns代理,也可以直接做内部纯dns服务器用。默认配置下,dnsmasq使用系统的/etc/resolv.conf并读取/etc/hosts,  /etc/resolv.conf文件是用来配置上一级DNS  /etc/hosts文件是用来存储dns代理缓存。 

2017-07-16 02:10:25 2046

转载 深度增强学习前沿算法思想【DQN、A3C、UNREAL,简介】

作者:Flood Sung,CSDN博主,人工智能方向研究生,专注于深度学习,增强学习与机器人的研究。责编:何永灿,欢迎人工智能领域技术投稿、约稿、给文章纠错,请发送邮件至[email protected]本文为《程序员》原创文章,未经允许不得转载,更多精彩文章请订阅2017年《程序员》2016年AlphaGo计算机围棋系统战胜顶尖职业棋手李世石,引起了全世界的广泛关注,人工智

2017-07-14 00:03:47 4289

转载 深度强化学习 Deep Reinforcement Learning 学习整理

这学期的一门机器学习课程中突发奇想,既然卷积神经网络可以识别一副图片,解决分类问题,那如果用神经网络去控制‘自动驾驶’,在一个虚拟的环境中不停的给网络输入车周围环境的图片,让它去选择前后左右中的一个操作,并给予适当的反馈,是否能够把‘驾驶问题’,转化为分类的问题,用神经网络解决呢。和经典的强化学习 Reinforcement Learning 最大的区别是,它将直接处理像素级的超高维度raw

2017-07-14 00:00:04 18066 1

转载 解读continuous control with deep reinforcement learning(DDPG)

版权声明:本文为博主原创文章,未经博主允许不得转载。博主:shenshikexmu联系方式:[email protected]缘起DDPG,是Google Deepmind第一篇关于连续动作的深度加强学习论文(是否第一篇存疑)。DQN(Deep Q Network)生成的策略执行的动作是离散或者低维的,虽然在状态输入上可以是高维的观察状态。如在DQN2014中

2017-07-13 17:53:08 2835 1

转载 Latex所有常用数学符号整理

这段时间用Latex很多,常常需要查阅相关特殊的符号,这里做一个整理,也方便大家查阅。摘自:《一份不太简短的LATEX2介绍》或112分钟学会LATEX2    原版作者:Tobias Oetiker

2017-07-11 22:19:00 1780

转载 Temporal-Difference (TD) Learning

【上一节蒙特卡洛方法(Monte Carlo Method)】  Temporal-difference (TD) learning可以说是增强学习的中心,它集成了蒙特卡洛思想和动态编程(dynamic programming, DP)思想,像蒙特卡洛方法一样,TD 方法不需要环境的动态模型,直接从经验经历中学习,像 DP 方法一样,TD 方法不需要等到最终的 outcome 才更新模型,

2017-07-11 15:30:33 2002

转载 CVPR 2017 Abstracts Collection

https://github.com/MichaelLiang12/CVPR-2017-Abstracts-Collection/blob/master/CVPR2017_Abstract_Collection.mdCVPR 2017 Abstracts CollectionCollection of CVPR 2017, including titles, lin

2017-07-11 12:58:36 32008

原创 ubuntu l2tp

sudo add-apt-repository ppa:nm-l2tp/network-manager-l2tp sudo apt-get update sudo apt-get install network-manager-l2tp

2017-07-08 17:30:26 694

directshow_SDK开发笔记

directshow_SDK开发笔记directshow_SDK开发笔记directshow_SDK开发笔记

2011-04-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除