- 博客(15)
- 资源 (1)
- 收藏
- 关注
原创 强化学习(四)单步模型Epsilon贪心逼近算法
Epsilon贪心算法基于一个概率Epsilon对探索(Exploration)和利用(Exploitation)进行折中:每次尝试时,以Epsilon概率进行探索,即以均匀分布概率随机选取一个摇臂博彩机;以1-Epsilon概率进行利用,即选择当前平均奖赏最高的摇臂博彩机(若有多个,则随机选取一个)。
2023-12-16 23:32:56 562 1
原创 强化学习(二)单步模型
单步强化学习对应了一个理论模型:K摇臂博彩机(K-armed Bandit)也称为K摇臂老虎机,也称为多摇臂博彩机问题(Multi-Armed Bandit Problem,MABP)。
2023-12-01 22:33:24 345 1
原创 强化学习(一)理论概念
强化学习(Reinforcement Learning)任务通常用马尔科夫决策过程(Markov Decision Process, 简称MDP)来描述。
2023-11-29 22:53:33 175 1
原创 [设计模式]总纲
Christopher Alexander: “每一个模式描述了一个在我们周围不断重复发生的问题,以及该问题的解决方案核心。这样,你就能一次一次地使用该方案而不必做重复劳动”。在抽象层面上对解决方案核心进行归纳总结用来构造可复用的面向对象设计。目前主流的设计模式为上图所示。设计模式种类划分准则为。根据范围可分为作用于。
2023-11-04 00:44:52 59 1
原创 现代滤波_粒子滤波学习笔记(一)
本文主要对粒子滤波(Particle Filter)的要点进行概要性的阐述,体现粒子滤波理论的基本衍生过程及基本原理,并在最后给出序贯重要性重采样算法的一般步骤。
2019-10-22 12:12:19 2083
转载 SVN服务器的搭建与使用(三)
原文地址:http://www.cnblogs.com/xiaobaihome/archive/2012/03/20/2408089.html接下来,试试用TortoiseSVN修改文件,添加文件,删除文件,以及如何解决冲突等.添加文件在检出的工作副本中添加一个Readme.txt文本文件,这时候这个文本文件会显示为没有版本控制的状态,如图:这时候,你需
2017-01-06 11:54:52 235
转载 SVN服务器的搭建与使用(二)
原文地址:http://www.cnblogs.com/xiaobaihome/archive/2012/03/20/2407979.html上一篇介绍了VisualSVN Server和TortoiseSVN的下载,安装,汉化.这篇介绍一下如何使用VisualSVN Server建立版本库,以及TortoiseSVN的使用.首先打开VisualSVN Server Manag
2017-01-06 11:52:59 207
转载 SVN服务器的搭建与使用(一)
原文地址:http://www.cnblogs.com/xiaobaihome/archive/2012/03/20/2407610.htmlSubversion是优秀的版本控制工具,其具体的的优点和详细介绍,这里就不再多说.首先来下载和搭建SVN服务器.现在Subversion已经迁移到apache网站上了,下载地址:http://subversion.apa
2017-01-06 11:50:30 211
转载 电子罗盘的工作原理及校准
原文地址:http://blog.csdn.net/wxlinwzl/article/details/6903548ST集成传感器方案实现电子罗盘功能电子罗盘是一种重要的导航工具,能实时提供移动物体的航向和姿态。随着半导体工艺的进步和手机操作系统的发展,集成了越来越多传感器的智能手机变得功能强大,很多手机上都实现了电子罗盘的功能。而基于电子罗盘的应用(如Android的Skymap)在
2016-12-21 18:19:36 16619
转载 关于const关键字与指针的相关使用要点
注意:文章转自http://blog.csdn.net/xiaocheng198810/article/details/41542473#编了这样的口诀,记住,应该不难:const(*号)左边放,我是指针变量指向常量;const(*号)右边放,我是指针常量指向变量;const(*号)两边放,我是指针常量指向常量;指针变量能改指向,指针常量不能
2016-12-20 17:03:57 300
转载 windows客户端开发调试工具
本文介绍windows常用开发与调试工具。1.windows常用开发与调试工具1.1 Sysinternals内核大神打造,含大量windows系统工具,windows开发必备神器,大神被MS招安。下载地址:http://technet.microsoft.com/en-us/sysinternalsProcmon.exe监视程序运行过程中的动作,可用于性能监控。
2014-07-31 00:52:35 633
原创 static的用途
(1) 函数内static变量的作用域为该函数体本身,不同于auto变量,该变量的内存只能分配一次,因此其值在下次调用时仍然保留上次的结果;(2) 模块内的static全局变量的作用域为该模块本身,不能被其他模块的函数访问;(3) 模块内的static函数的作用域为该模块本身,只可被本模块的函数访问,其使用范围被限制在声明它的模块内;(4) 在类中的static成员变量
2014-07-28 15:14:50 486
转载 C引用与指针的比较
C 引用与指针的比较 引用是C 中的概念,初学者容易把引用和指针混淆一起。 一下程序中,n是m的一个引用(reference),m是被引用物(n相当于m的别名(绰号),对n的任何操作就是对m的操作。 所以n既不是m的拷贝,也不是指向m的指针,其实n就是m它自己。 引用的规则: (1)引用被创建的同时必须被初始化(指针则可以在任何时候被初始化)。 (2)不能
2014-07-28 13:53:49 795
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人