一路没你-CSDN博客

原创 ssh-agent用法详解

记录转载，侵删ssh-agent详解

2021-06-15 10:28:57 443

原创 Adaboost公式推导补充

AdaBoost和前向分步算法AdaBoost可以理解为一个前向分步算法，前向分步算法是一个加法模型，其表达式为：f(x)=∑t=1Tαtht(x)f(x)=\sum_{t=1}^T \alpha_th_t(x)f(x)=t=1∑Tαtht(x)对应于上面公式推导的弱分类器的输出。在AdaBoost中的前向分步算法的损失函数为指数损失函数：L(y,f(x))=exp[−yf(...

2019-09-06 16:58:41 317

原创基于策略的强化学习公式推导

基于策略的强化学习就是最大化平均收益Rˉ\bar{R}Rˉ，公式如下：Rˉ=∑τPθ(τ)R(τ)\bar{R}=\sum_\tau P_{\theta}(\tau)R(\tau)Rˉ=τ∑Pθ(τ)R(τ)其中，τ\tauτ为一个episode，可以写成{s1,a1,r1,…,sH,aH,rHs_1,a_1,r_1,\dots,s_H,a_H,r_Hs1,a1,r1,…,sH...

2019-08-27 15:07:40 1007

原创寝室卫生问题的博弈分析及其解决方案

看了一篇知乎，有感而发，具体建模分析一下寝室卫生问题。寝室的卫生问题属于典型的“智猪博弈”’困局，这边就不具体讲了，有兴趣可以自己百度什么的，接下来直接进入正题。分析两人寝室，住着小A和小B，小A比较能忍受脏乱的环境（难听点就是不爱干净），小B就比较爱干净了，那么下面我们如下两个假设：1.打扫卫生，对于小A来说，环境满意度提升2个点，而对于小B来说提升6个点。（说明：小A不爱干净，干不干净...

2019-07-06 22:38:22 1419 2

原创特征选择

参考文章：https://www.cnblogs.com/pinard/p/9032759.html 和西瓜书特征选择是数据预处理的一种，主要有三种方式：过滤式选择，包裹式选择和嵌入式选择。过滤式选择过滤式选择，顾名思义，就是过滤掉不需要的特征或者说选择更有用的特征。那么如何判断特征是否有用，是否需要呢？这个标准其实有很多，我们下面列举几个：相关系数求解某一特征和标签的相...

2019-06-21 10:07:34 652

原创 Adaboost算法

集成学习有两大类：bagging和boosting。随机森林是bagging的一个例子，而Adaboost是boosting的典型算法。什么是boosting bagging算法是由多个学习器组成的，但是学习器之间是并行\color{#FF0000}{并行}并行的，意思就是学习器之间互补干扰，各自训练各自的，各自测试各自的数据，然后通过整合每个学习器返回的数据最终得到结果。整合...

2019-06-13 15:51:48 267

原创最大似然和EM算法

最大似然你知道一个分布，但是不知道分布的具体参数，比如你知道学校男生身高分布服从高斯分布，但是你不知道其参数，即θ=[u,σ]\theta=[u,\sigma]θ=[u,σ]。这是就可以使用最大似然来求解参数。首先需要从该分布中采样获取数据，比如你获取了NNN个数据，就可以得到其似然函数，如下：L(θ)=L(x1,…,xn;θ)=∏i=1Np(xi;θ)L(\theta)=...

2019-06-11 16:54:53 268

原创强化学习入门，分类及总结

自学强化学习，主要是看了网上大佬们写的一些文章，都是零零碎碎的强化学习的算法，所以这篇文章主要是总结我学的知识，可能知识点不是很全，后期慢慢补充吧，如果有理解错误也烦请指出。主要参考资料：知乎天津肉包子馅儿、莫烦、还有刘建平博客。概述如上图，强化学习就是智能体和环境交互的过程，是一个马尔科夫决策过程\color{red}{马尔科夫决策过程}马尔科夫决策过程（当前状态仅与上个状态和所做的...

2019-04-11 23:34:59 467

原创 latex中缩写的引用

记录一下我自己写论文时用到的操作，参考网站首先引用包\usepackage[acronym]{glossaries}\makeglossaries定义缩写\newacronym{FN}{FN}{fog node}其中第一个FN是标签（下文引用的时候就写这个），第二个FN是会显示在你文章中的缩写，第三个就是全称。上面这代码等价于\newglossaryentry{FN}{ n...

2019-03-29 21:04:10 7827 1

原创简单的PPO算法笔记

学习了莫烦讲解的PPO，写了点自己的理解笔记，希望能帮到你们。代码代码可以去上面的链接自己下载跑一下，这边也给出我参考莫烦自己学的，基本是一样的：import gymimport tensorflow as tfimport numpy as npimport matplotlib.pyplot as pltEP_MAX = 1000EP_LEN = 200BATCH =...

2019-03-10 17:03:42 28713 33

原创 Policy Gradient(PG算法)理解笔记

学习PG算法，看了很多的文章，看代码也花了不少时间，这篇文章主要写莫烦老师给的程序的理解，当然也结合了一些文章里面的公式推导，还参考了其他相关的文章代码这边直接给出莫烦老师的RL代码，其他剩余的理解不难，可以自己下载。import numpy as npimport tensorflow as tf# reproduciblenp.random.seed(1)tf.set_ra...

2019-02-28 15:13:56 8380 4

原创 LSTM模型与前向反向传播算法笔记

这篇文章是看了刘建平老师的LSTM模型与前向反向传播算法后的笔记，同时参考这两篇文章，包括一些公式推导，都是自己的理解，如有错误，欢迎指出。LSTM前向传播算法这边直接给出前向传播过程中的公式计算，具体的可以参考上面文章： x(t)−n×1,x^{(t)}-n\times1,x(t)−n×1,...

2019-01-31 10:24:55 1018 8

原创循环神经网络(RNN)模型与前向反向传播算法笔记

这篇文章是看了刘建平老师的循环神经网络(RNN)模型与前向反向传播算法后的笔记，包括一些公式推导，都是自己的理解，如有错误，欢迎指出。RNN模型RNN主流模型： 1. x(t)x^{(t)}x(t)代表在序列索引号ttt时训练样本的输入，是nnnx111的向量； 2. h(t)h^{(t)}h(t)代表在序列索引号ttt时模型的隐藏状态，为mmmx111的向量； 3. o(t...

2019-01-28 11:32:42 1757 6

&amp;lt; Data Structures andAlgorithms in Python &amp;gt; Michael T.Goodrich,Roberto Tamassia,Michael H.Goldwasser 学习笔记双向链表的实现&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;和单向链表不同，双向链表添加了头节点和尾节点，这两个节点不存储元素。它

2018-11-29 09:41:44 312

原创 Python中的链表之单向链表实现栈和队列

Python中除了列表，还有链表这样的基础数据结构，之前我们都是介绍用列表实现栈、队列这样的数据结构的，接下来我们看一下用链表实现的栈和队列。既然列表已经可以实现栈和队列了，那么链表又有什么存在的意义呢？当然是因为列表有一些明细的缺点：内存的分配：底层数组大小要比实际列表的大；摊销的边界：底层数组已满时，继续向列表中添加元素，由于要换底层数组并转移数据，这时的时间复杂度明显要比之前添加元素...

2018-11-25 19:53:44 1613 1

原创 Python用列表实现栈，队列（二）

用列表实现队列&amp;amp;nbsp; &amp;amp;nbsp; &amp;amp;nbsp; &amp;amp;nbsp;队列和栈实现的功能差不多，无非是入队列，出队列，队列长度等等。其中，入队列可以用列表的append()来实现，出队列可以使用pop(0)来实现。由于这个实现方法比较简单，因此它也是最低效的。append方法入队列和栈实现分析的一样，每次添加元素都有可能要换底层数组，所以效率不高；pop(0)操作的调用总是最坏情

2018-11-25 15:10:12 409

原创 Python用列表实现栈，队列（一）

用列表实现栈栈方法列表实现S.push()L.append()S.pop()L.pop()S.top()L[-1]S.is_empty()len(L)==0len(S)len(L)如上表，栈功能的实现分别对应于列表的以上方法，代码如下：class Empty(Exception): def __init__(self, m)...

2018-11-24 21:12:36 864

原创 python动态数组和摊销分析

python动态数组和摊销分析python中创建数组，计算机系统先会创建一个低层次数组，以便系统为其存储分配连续内存，通常情况下，底层数组会比列表的长度更长。当我们声明一个列表list，并向其中添加元素，一旦元素数量超过底层数组的大小，列表类会向系统重新申请一个更大的底层数组，并使这个更大的底层数组的前面部分和原来的数字一样。这时原来的数组就不需要了，会给系统回收，这样一来，可以继续向列表中添加...

2018-11-13 16:48:25 2125

zhisuihen6347的博客