自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 资源 (2)
  • 收藏
  • 关注

原创 ssh-agent用法详解

记录转载,侵删ssh-agent详解

2021-06-15 10:28:57 443

原创 Adaboost公式推导补充

AdaBoost和前向分步算法AdaBoost可以理解为一个前向分步算法,前向分步算法是一个加法模型,其表达式为:f(x)=∑t=1Tαtht(x)f(x)=\sum_{t=1}^T \alpha_th_t(x)f(x)=t=1∑T​αt​ht​(x)对应于上面公式推导的弱分类器的输出。在AdaBoost中的前向分步算法的损失函数为指数损失函数:L(y,f(x))=exp[−yf(...

2019-09-06 16:58:41 317

原创 基于策略的强化学习公式推导

基于策略的强化学习就是最大化平均收益Rˉ\bar{R}Rˉ,公式如下:Rˉ=∑τPθ(τ)R(τ)\bar{R}=\sum_\tau P_{\theta}(\tau)R(\tau)Rˉ=τ∑​Pθ​(τ)R(τ)其中,τ\tauτ为一个episode,可以写成{s1,a1,r1,…,sH,aH,rHs_1,a_1,r_1,\dots,s_H,a_H,r_Hs1​,a1​,r1​,…,sH​...

2019-08-27 15:07:40 1007

原创 寝室卫生问题的博弈分析及其解决方案

看了一篇知乎,有感而发,具体建模分析一下寝室卫生问题。寝室的卫生问题属于典型的“智猪博弈”’困局,这边就不具体讲了,有兴趣可以自己百度什么的,接下来直接进入正题。分析两人寝室,住着小A和小B,小A比较能忍受脏乱的环境(难听点就是不爱干净),小B就比较爱干净了,那么下面我们如下两个假设:1.打扫卫生,对于小A来说,环境满意度提升2个点,而对于小B来说提升6个点。(说明:小A不爱干净,干不干净...

2019-07-06 22:38:22 1419 2

原创 特征选择

参考文章:https://www.cnblogs.com/pinard/p/9032759.html 和西瓜书特征选择是数据预处理的一种,主要有三种方式:过滤式选择,包裹式选择和嵌入式选择。过滤式选择    过滤式选择,顾名思义,就是过滤掉不需要的特征或者说选择更有用的特征。那么如何判断特征是否有用,是否需要呢?这个标准其实有很多,我们下面列举几个:相关系数    求解某一特征和标签的相...

2019-06-21 10:07:34 652

原创 Adaboost算法

集成学习有两大类:bagging和boosting。随机森林是bagging的一个例子,而Adaboost是boosting的典型算法。什么是boosting    bagging算法是由多个学习器组成的,但是学习器之间是并行\color{#FF0000}{并行}并行的,意思就是学习器之间互补干扰,各自训练各自的,各自测试各自的数据,然后通过整合每个学习器返回的数据最终得到结果。    整合...

2019-06-13 15:51:48 267

原创 最大似然和EM算法

最大似然    你知道一个分布,但是不知道分布的具体参数,比如你知道学校男生身高分布服从高斯分布,但是你不知道其参数,即θ=[u,σ]\theta=[u,\sigma]θ=[u,σ]。这是就可以使用最大似然来求解参数。    首先需要从该分布中采样获取数据,比如你获取了NNN个数据,就可以得到其似然函数,如下:L(θ)=L(x1,…,xn;θ)=∏i=1Np(xi;θ)L(\theta)=...

2019-06-11 16:54:53 268

原创 强化学习入门,分类及总结

自学强化学习,主要是看了网上大佬们写的一些文章,都是零零碎碎的强化学习的算法,所以这篇文章主要是总结我学的知识,可能知识点不是很全,后期慢慢补充吧,如果有理解错误也烦请指出。主要参考资料:知乎天津肉包子馅儿、莫烦、还有刘建平博客。概述如上图,强化学习就是智能体和环境交互的过程,是一个马尔科夫决策过程\color{red}{马尔科夫决策过程}马尔科夫决策过程(当前状态仅与上个状态和所做的...

2019-04-11 23:34:59 467

原创 latex中缩写的引用

记录一下我自己写论文时用到的操作,参考网站首先引用包\usepackage[acronym]{glossaries}\makeglossaries定义缩写\newacronym{FN}{FN}{fog node}其中第一个FN是标签(下文引用的时候就写这个),第二个FN是会显示在你文章中的缩写,第三个就是全称。上面这代码等价于\newglossaryentry{FN}{ n...

2019-03-29 21:04:10 7827 1

原创 简单的PPO算法笔记

学习了莫烦讲解的PPO,写了点自己的理解笔记,希望能帮到你们。代码代码可以去上面的链接自己下载跑一下,这边也给出我参考莫烦自己学的,基本是一样的:import gymimport tensorflow as tfimport numpy as npimport matplotlib.pyplot as pltEP_MAX = 1000EP_LEN = 200BATCH =...

2019-03-10 17:03:42 28713 33

原创 Actor-Critic(AC)算法笔记

1

2019-03-02 21:31:20 6172 9

原创 Policy Gradient(PG算法)理解笔记

学习PG算法,看了很多的文章,看代码也花了不少时间,这篇文章主要写莫烦老师给的程序的理解,当然也结合了一些文章里面的公式推导,还参考了其他相关的文章代码这边直接给出莫烦老师的RL代码,其他剩余的理解不难,可以自己下载。import numpy as npimport tensorflow as tf# reproduciblenp.random.seed(1)tf.set_ra...

2019-02-28 15:13:56 8380 4

原创 LSTM模型与前向反向传播算法笔记

这篇文章是看了刘建平老师的LSTM模型与前向反向传播算法后的笔记,同时参考这两篇文章,包括一些公式推导,都是自己的理解,如有错误,欢迎指出。LSTM前向传播算法这边直接给出前向传播过程中的公式计算,具体的可以参考上面文章: x(t)−n×1,x^{(t)}-n\times1,x(t)−n×1,...

2019-01-31 10:24:55 1018 8

原创 循环神经网络(RNN)模型与前向反向传播算法笔记

这篇文章是看了刘建平老师的循环神经网络(RNN)模型与前向反向传播算法后的笔记,包括一些公式推导,都是自己的理解,如有错误,欢迎指出。RNN模型RNN主流模型:  1. x(t)x^{(t)}x(t)代表在序列索引号ttt时训练样本的输入,是nnnx111的向量;  2. h(t)h^{(t)}h(t)代表在序列索引号ttt时模型的隐藏状态,为mmmx111的向量;  3. o(t...

2019-01-28 11:32:42 1757 6

原创 Python中的链表之双向链表

< Data Structures andAlgorithms in Python > Michael T.Goodrich,Roberto Tamassia,Michael H.Goldwasser 学习笔记双向链表的实现       和单向链表不同,双向链表添加了头节点和尾节点,这两个节点不存储元素。它

2018-11-29 09:41:44 312

原创 Python中的链表之单向链表实现栈和队列

Python中除了列表,还有链表这样的基础数据结构,之前我们都是介绍用列表实现栈、队列这样的数据结构的,接下来我们看一下用链表实现的栈和队列。既然列表已经可以实现栈和队列了,那么链表又有什么存在的意义呢?当然是因为列表有一些明细的缺点:内存的分配:底层数组大小要比实际列表的大;摊销的边界:底层数组已满时,继续向列表中添加元素,由于要换底层数组并转移数据,这时的时间复杂度明显要比之前添加元素...

2018-11-25 19:53:44 1613 1

原创 Python用列表实现栈,队列(二)

用列表实现队列       队列和栈实现的功能差不多,无非是入队列,出队列,队列长度等等。其中,入队列可以用列表的append()来实现,出队列可以使用pop(0)来实现。由于这个实现方法比较简单,因此它也是最低效的。append方法入队列和栈实现分析的一样,每次添加元素都有可能要换底层数组,所以效率不高;pop(0)操作的调用总是最坏情

2018-11-25 15:10:12 409

原创 Python用列表实现栈,队列(一)

用列表实现栈栈方法列表实现S.push()L.append()S.pop()L.pop()S.top()L[-1]S.is_empty()len(L)==0len(S)len(L)如上表,栈功能的实现分别对应于列表的以上方法,代码如下:class Empty(Exception): def __init__(self, m)...

2018-11-24 21:12:36 864

原创 python动态数组和摊销分析

python动态数组和摊销分析python中创建数组,计算机系统先会创建一个低层次数组,以便系统为其存储分配连续内存,通常情况下,底层数组会比列表的长度更长。当我们声明一个列表list,并向其中添加元素,一旦元素数量超过底层数组的大小,列表类会向系统重新申请一个更大的底层数组,并使这个更大的底层数组的前面部分和原来的数字一样。这时原来的数组就不需要了,会给系统回收,这样一来,可以继续向列表中添加...

2018-11-13 16:48:25 2125

李宏毅强化学习ppo算法ppt

李宏毅强化学习ppo算法ppt

2019-04-11

Qt5开发与实例第三版本光盘资源

Qt5 开发与实例第三版本光盘资源 包含课程ppt 实例源程序

2018-05-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除