neusxw-CSDN博客

原创 2021-03-16

# 强化学习笔记标签（空格分隔）：强化学习#1. 概述## 1.1 智能体主要组成### 1. 策略智能体在各个状态下的各种可能的行为概率\begin{aligned}\pi (a|s) = P(A_t = a | S_t = s)\end{aligned}### 2. 值函数1). 状态值函数\begin{aligned}V_{\pi}(s) & = E_{\pi}[G_t|S_t = s]\\&=E_{\pi}[R_{t+1}+\gamma R_{t+2}.

2021-03-16 17:26:15 169

转载漫画：什么是动态规划？

https://www.sohu.com/a/153858619_466939

2018-07-23 20:44:27 904

转载 XML在JAVA项目中的作用

https://www.cnblogs.com/yefengCrazy/p/5636661.htmljava项目中,xml文件一般都是用来存储一些配置信息一般的编程, 多数用来存储配置信息 . 拿JDBC来说,可以把数据库连接字符串写到xml,如果要修改数据源,只需要改xml就可以了,没必要再去重新编译java文件,而且,这些配置信息放在一起,别的人来读你写的代码的时候,就方便了很

2018-01-07 01:14:57 1162

转载 java 中变量存储位置的区别

http://www.cnblogs.com/ling2/p/4324650.html

2017-11-07 22:45:13 199

转载偏最小二乘法回归

http://www.cnblogs.com/jerrylead/archive/2011/08/21/2148625.html1. 问题这节我们请出最后的有关成分分析和回归的神器PLSR。PLSR感觉已经把成分分析和回归发挥到极致了，下面主要介绍其思想而非完整的教程。让我们回顾一下最早的Linear Regression的缺点：如果样例数m相比特征数n少

2017-09-02 01:45:12 1779

转载交替最小二乘法

http://www.cnblogs.com/skyEva/p/5570098.html1. 基础回顾矩阵的奇异值分解 SVD（特别详细的总结，参考 http://blog.csdn.net/wangzhiqing3/article/details/7446444）矩阵与向量相乘的结果与特征值，特征向量有关。数值小的特征值对矩阵-向量相乘的结果贡献小

2017-09-02 00:16:59 1325

转载无免费午餐定理

最优化理论的发展之一是wolpert和Macerday提出了没有免费的午餐定理(noerfelunhchtocerm，简称NFL)。该定理的结论是，由于对所有可能函数的相互补偿，最优化算法的性能是等价的。该定理暗指，没有其它任何算法能够比搜索空间的线性列举或者纯随机搜索算法更优。该定理只是定义在有限的搜索空间，对无限搜索空间结论是否成立尚不清楚。

2009-08-03 15:21:00 1128

智能优化算法--遗传算法模拟退火禁忌搜索蚁群算法等

系统介绍智能优化算法的一般内容和方法，包含遗传算法模拟退火禁忌搜索蚁群算法，以及新进发展起来的算法.

2009-04-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

智能优化算法--遗传算法 模拟退火 禁忌搜索 蚁群算法等

空空如也

智能优化算法--遗传算法模拟退火禁忌搜索蚁群算法等