- 博客(11)
- 资源 (1)
- 收藏
- 关注
转载 在Linux 中 build 开源人脸识别引擎SeetaFace
一.安装OpenCV 依赖1. Require Packages[compiler] sudo apt-get install build-essential[required] sudo apt-get install cmake git libgtk2.0-dev pkg-config libavcodec-dev libavformat-dev libswscale-dev[
2017-07-28 19:30:31 902
转载 Boost.Asio入门
Boost.Asio入门首先,让我们先来了解一下什么是Boost.Asio?怎么编译它?了解的过程中我们会给出一些例子。然后在发现Boost.Asio不仅仅是一个网络库的同时你也会接触到Boost.Asio中最核心的类——io_service。什么是Boost.Asio简单来说,Boost.Asio是一个跨平台的、主要用于网络和其他一些底层输入/输出编程的C++库。计算机网络的设计
2017-07-22 11:34:39 1199
转载 业界 | OpenAI提出强化学习近端策略优化,可替代策略梯度法
选自OpenAI机器之心编辑部参与:蒋思源、Smith近日,OpenAI 发布了一种新型的强化学习算法,近端策略优化(Proximal Policy Optimization/PPO)算法,该算法的实现和调参十分简单,并且它的性能甚至要超过现阶段最优秀的方法。因为该算法实现非常简单并且有优秀的性能,PPO 已经成为了 OpenAI 默认使用的强化学习算法。
2017-07-21 13:28:32 3154
转载 dnsmasq使用注意事项
DNS服务器,linux下一般用bind,但bind太复杂了,dnsmasq使用上比dns始祖bind要简便得多,可以做正向dns代理,也可以直接做内部纯dns服务器用。默认配置下,dnsmasq使用系统的/etc/resolv.conf并读取/etc/hosts, /etc/resolv.conf文件是用来配置上一级DNS /etc/hosts文件是用来存储dns代理缓存。
2017-07-16 02:10:25 2089
转载 深度增强学习前沿算法思想【DQN、A3C、UNREAL,简介】
作者:Flood Sung,CSDN博主,人工智能方向研究生,专注于深度学习,增强学习与机器人的研究。责编:何永灿,欢迎人工智能领域技术投稿、约稿、给文章纠错,请发送邮件至heyc@csdn.net本文为《程序员》原创文章,未经允许不得转载,更多精彩文章请订阅2017年《程序员》2016年AlphaGo计算机围棋系统战胜顶尖职业棋手李世石,引起了全世界的广泛关注,人工智
2017-07-14 00:03:47 4360
转载 深度强化学习 Deep Reinforcement Learning 学习整理
这学期的一门机器学习课程中突发奇想,既然卷积神经网络可以识别一副图片,解决分类问题,那如果用神经网络去控制‘自动驾驶’,在一个虚拟的环境中不停的给网络输入车周围环境的图片,让它去选择前后左右中的一个操作,并给予适当的反馈,是否能够把‘驾驶问题’,转化为分类的问题,用神经网络解决呢。和经典的强化学习 Reinforcement Learning 最大的区别是,它将直接处理像素级的超高维度raw
2017-07-14 00:00:04 18166 1
转载 解读continuous control with deep reinforcement learning(DDPG)
版权声明:本文为博主原创文章,未经博主允许不得转载。博主:shenshikexmu联系方式:shenshikexmu@163.com缘起DDPG,是Google Deepmind第一篇关于连续动作的深度加强学习论文(是否第一篇存疑)。DQN(Deep Q Network)生成的策略执行的动作是离散或者低维的,虽然在状态输入上可以是高维的观察状态。如在DQN2014中
2017-07-13 17:53:08 2855 1
转载 Latex所有常用数学符号整理
这段时间用Latex很多,常常需要查阅相关特殊的符号,这里做一个整理,也方便大家查阅。摘自:《一份不太简短的LATEX2介绍》或112分钟学会LATEX2 原版作者:Tobias Oetiker
2017-07-11 22:19:00 1822
转载 Temporal-Difference (TD) Learning
【上一节蒙特卡洛方法(Monte Carlo Method)】 Temporal-difference (TD) learning可以说是增强学习的中心,它集成了蒙特卡洛思想和动态编程(dynamic programming, DP)思想,像蒙特卡洛方法一样,TD 方法不需要环境的动态模型,直接从经验经历中学习,像 DP 方法一样,TD 方法不需要等到最终的 outcome 才更新模型,
2017-07-11 15:30:33 2146
转载 CVPR 2017 Abstracts Collection
https://github.com/MichaelLiang12/CVPR-2017-Abstracts-Collection/blob/master/CVPR2017_Abstract_Collection.mdCVPR 2017 Abstracts CollectionCollection of CVPR 2017, including titles, lin
2017-07-11 12:58:36 35083
原创 ubuntu l2tp
sudo add-apt-repository ppa:nm-l2tp/network-manager-l2tp sudo apt-get update sudo apt-get install network-manager-l2tp
2017-07-08 17:30:26 713
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人