自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (1)
  • 收藏
  • 关注

原创 2021-03-16

# 强化学习笔记标签(空格分隔): 强化学习#1. 概述## 1.1 智能体主要组成### 1. 策略智能体在各个状态下的各种可能的行为概率\begin{aligned}\pi (a|s) = P(A_t = a | S_t = s)\end{aligned}### 2. 值函数1). 状态值函数\begin{aligned}V_{\pi}(s) & = E_{\pi}[G_t|S_t = s]\\&=E_{\pi}[R_{t+1}+\gamma R_{t+2}.

2021-03-16 17:26:15 169

转载 漫画:什么是动态规划?

https://www.sohu.com/a/153858619_466939

2018-07-23 20:44:27 904

转载 XML在JAVA项目中的作用

https://www.cnblogs.com/yefengCrazy/p/5636661.htmljava项目中,xml文件一般都是用来存储一些配置信息一般的编程, 多数用来存储配置信息 . 拿JDBC来说,可以把数据库连接字符串写到xml,如果要修改数据源,只需要改xml就可以了,没必要再去重新编译java文件,而且,这些配置信息放在一起,别的人来读你写的代码的时候,就方便了很

2018-01-07 01:14:57 1162

转载 java 中变量存储位置的区别

http://www.cnblogs.com/ling2/p/4324650.html

2017-11-07 22:45:13 199

转载 偏最小二乘法回归

http://www.cnblogs.com/jerrylead/archive/2011/08/21/2148625.html1. 问题     这节我们请出最后的有关成分分析和回归的神器PLSR。PLSR感觉已经把成分分析和回归发挥到极致了,下面主要介绍其思想而非完整的教程。让我们回顾一下最早的Linear Regression的缺点:如果样例数m相比特征数n少

2017-09-02 01:45:12 1779

转载 交替最小二乘法

http://www.cnblogs.com/skyEva/p/5570098.html1. 基础回顾矩阵的奇异值分解 SVD(特别详细的总结,参考 http://blog.csdn.net/wangzhiqing3/article/details/7446444)矩阵与向量相乘的结果与特征值,特征向量有关。数值小的特征值对矩阵-向量相乘的结果贡献小

2017-09-02 00:16:59 1325

转载 无免费午餐定理

    最优化理论的发展之一是wolpert和Macerday提出了没有免费的午餐定理(noerfelunhchtocerm,简称NFL)。该定理的结论是,由于对所有可能函数的相互补偿,最优化算法的性能是等价的。该定理暗指,没有其它任何算法能够比搜索空间的线性列举或者纯随机搜索算法更优。该定理只是定义在有限的搜索空间,对无限搜索空间结论是否成立尚不清楚。

2009-08-03 15:21:00 1128

智能优化算法--遗传算法 模拟退火 禁忌搜索 蚁群算法等

系统介绍智能优化算法的一般内容和方法,包含遗传算法 模拟退火 禁忌搜索 蚁群算法,以及新进发展起来的算法.

2009-04-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除