算法
文章平均质量分 87
好奇小圈
华工在读,立志成为一只大佬
展开
-
POPULATION-BASED REINFORCEMENT LEARNING FOR COMBINATORIAL OPTIMIZATION PROBLEMS 学习笔记
使用强化学习来解决组合优化问题很具有吸引力,因为它去除了专家知识或预解决实例的需求。然而,期待一个智能体(agent)在一次推断中来解决这些困难问题(常常为NP-hard)是不现实的,因为问题内在的复杂性。因此,领先方法通常实现额外的搜索策略,从随机抽样和波束搜索到显式微调。本文中,我们主张学习大量补充政策的好处,它可以在推理时同时推演(rollout)。为此,我们介绍Poppy,一个简单的有理论基础的群(population)训练程序。翻译 2023-01-28 16:48:20 · 236 阅读 · 0 评论 -
Seeking Multiple Solutions of Combinatorial optimization Problems: A Proof of Principle Study 学习笔记
Seeking Multiple Solutions of Combinatorial optimization Problems: A Proof of Principle Study 学习笔记,翻译翻译 2022-12-29 14:29:33 · 313 阅读 · 0 评论 -
POMO: Policy Optimization with Multiple Optima for Reinforcement Learning学习笔记
POMO算法的学习笔记,包含基础知识铺垫、原文总结翻译、相关领域补充。POMO是一种基于深度强化学习的纯数据驱动的组合优化方法,它避免了由领域专家手工构建的启发式方法。在训练和推理阶段,POMO利用CO问题的多个最优解的存在,有效地引导自己达到最优。与其他结构的深度RL方法相比,POMO在缩小最优性差距和减少推理时间方面达到了最先进的性能。原创 2022-12-24 00:04:09 · 2535 阅读 · 4 评论 -
YOLO算法(You Only Look Once)系列讲解与实现(待完善)
YOLO算法学习笔记原创 2022-11-25 14:56:49 · 2144 阅读 · 0 评论 -
异构图注意力网络Heterogeneous Graph Attention Network ( HAN )
异构图注意力网络Heterogeneous Graph Attention Network ( HAN )学习笔记。原创 2022-11-24 16:23:51 · 2787 阅读 · 2 评论 -
强化学习 补充笔记(TD算法、Q学习算法、SARSA算法、多步TD目标、经验回放、高估问题、对决网络、噪声网络)
深入了解马尔科夫决策过程(MDP),包含TD算法、Q学习算法、SARSA算法、多步TD目标、经验回放、高估问题、对决网络、噪声网络。基础部分见:强化学习 马尔科夫决策过程(价值迭代、策略迭代、雅克比迭代、蒙特卡洛)原创 2022-11-23 23:41:06 · 698 阅读 · 0 评论 -
强化学习 马尔科夫决策过程(价值迭代、策略迭代、雅克比迭代、蒙特卡洛)
本文讲解了Markov过程、奖励过程、决策过程三个方面。包含价值迭代、策略迭代、雅克比迭代(解决自举问题)、蒙特卡洛(无模型)方式。原创 2022-11-22 23:48:19 · 1673 阅读 · 0 评论 -
Kalman filtering卡尔曼滤波和Particle Filter粒子滤波及其MATLAB实现
通过寻找一组在状态空间中传播的随机样本来近似的表示概率密度函数,用样本均值代替积分运算,进而获得系统状态的最小方差估计的过程,这些样本被形象的称为“粒子”,故而叫粒子滤波Particle Filter。在经济学领域,粒子滤波被应用在经济数据预测;在军事领域已经被应用于雷达跟踪空中飞行物,空对空、空对地的被动式跟踪;在自动驾驶中,它被应用于目标检测;交通管制领域它被应用在对车或人视频监控;它还用于机器人的全局定位。原创 2022-10-12 03:44:24 · 954 阅读 · 0 评论 -
GMM高斯混合模型
阅读背景差分算法相关文献碰到了这个模型,比较生疏,故此学习。一、基本概念如图所示,横轴上的数据集的密度函数可以视为两个高斯分布的叠加。从几何角度看,可以将其视为多个高斯分布叠加的加权平均。p(x)=∑k=1KαkN()p(x)=\sum_{k=1}^K \alpha_k N()p(x)=k=1∑KαkN()原创 2022-04-22 10:47:43 · 261 阅读 · 0 评论 -
HMM隐马尔科夫模型及MATLAB实现
隐马尔科夫模型文章目录隐马尔科夫模型前言一、定义二、三个基本问题1、观测序列概率2、模型参数学习3、预测(解码)问题总结前言隐马尔科夫模型(HMM)是在马尔科夫链上的一个扩展,属于机器学习,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析一、定义隐状态集合:Q={q1,q2,…,qN}可观测态集合:V={v1,v2,…,vN}状态序列:I={i1,i2,…,iN}观察态序列:O={o1,o2,…,oN}状态转原创 2022-02-26 15:38:09 · 6610 阅读 · 6 评论 -
粒子群算法(3)粒子群算法的其他应用(待完善)
粒子群算法(2)求解方程组思路案例vpasolve法fsolve法可用format long g显示更多的小数位置。@my_fun:粒子群算法@Obj_fun结论:(1) vpasolve函数和fsolve函数需要给定一个比较好的初始值,如果初始值没给好则求不出结果;(2)粒子群算法不需要给初始值,只需要给一个搜索的范围。由于算法本身具有随机性, 因此可能需要多次运行才能得到一个较好的结果。多元函数拟合案例其他方法绘制相对误差图...原创 2021-08-29 23:36:33 · 196 阅读 · 0 评论 -
粒子群算法(2)
上一期:粒子群算法(1)线性递减惯性权重惯性权重w体现的是粒子继承先前的速度的能力,Shi,Y最先将惯性权重w引入到粒子群算法中,并分析指出一个较大的惯性权值有利于全局搜索,而一个较小的权值则更利于局部搜索。为了更好地平衡算法的全局搜索以及局部搜索能力,Shi,Y提出了线性递减惯性权重LDIW(Linear Decreasing Inertia Weight),公式如下:...原创 2021-08-29 18:16:49 · 1949 阅读 · 7 评论 -
决策树与随机森林
决策树简介决策树算法以树状结构表示数据分类的结果。每个决策点实现一个具有离散输出的测试函数,记为分支。f(x)={根结点非叶子节点(决策点)叶子节点分支 f(x)=\left\{\begin{aligned}根结点 \\非叶子节点(决策点) \\叶子节点 \\分支\end{aligned}\right.f(x)=⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧根结点非叶子节点(决策点)叶子节点分支熵P(X,Y)=P(X)∗P(Y)XP(X, Y)=P(X)^{*} P(Y) \quad XP(X,Y)原创 2021-08-28 23:09:31 · 696 阅读 · 0 评论 -
粒子群算法(1)
粒子群算法1.入门粒子群算法,其全称为粒子群优化算法(Particle Swarm Optimization,PsO)。它是通过模拟鸟群觅食行为而发展起来的一种基于群体协作的搜索算法。2.什么是启发式算法?启发式算法百度百科上的定义:一个基于直观或经验构造的算法,在可接受的花费下给出待解决优化问题的一个可行解。(1)什么是可接受的花费?计算时间和空间能接受(求解一个问题要几万年or一万台电脑)(2)什么是优化问题?工程设计中优化问题(optimization problem)指在一定约束条件原创 2021-08-23 17:36:24 · 1535 阅读 · 1 评论 -
DBSCAN算法简介
文章目录前言一、示例网站二、DBSCAN数据点分类三、伪代码四、DBSCAN的优缺点前言DBSCAN(Density-based spatial clustering of applicationswith noise)是Martin Ester, Hans-PeterKriegel等人于1996年提出的一种基于密度的聚类方法,聚类前不需要预先指定聚类的个数,生成的簇的个数不定(和数据有关)。该算法利用基于密度的聚类的概念,即要求聚类空间中的一定区域内所包含对象(点或其他空间对象)的数目不小于某一给.原创 2021-08-12 00:18:55 · 2980 阅读 · 0 评论 -
基于SPSS的K均值算法
文章目录前言一、K均值算法是什么?二、动画演示1.网站2.示例三、缺点解决(K-means++算法)四、SPSS实现总结前言菜鸡学习数学建模一、K均值算法是什么?K-means聚类的算法流程:一、指定需要划分的簇的个数K值(类的个数);二、随机地选择K个数据对象作为初始的聚类中心(不一定要是我们的样本点) ;三、计算其余的各个数据对象到这K个初始聚类中心的距离,把数据对象划归到距离它最近的那个中心所处在的簇类中;四、调整新类并且重新计算出新类的中心;五、循环步骤三和四,看中心是否收.原创 2021-08-10 18:57:48 · 2189 阅读 · 0 评论 -
基于SPSS的Fisher线性判别分析(国赛数模2020C第二题为例)
文章目录前言一、2020C题目二、选取指标1.未归一化指标2.归一化、正向化三、Fisher判别法介绍四、SPSS的使用总结前言学习数学建模过程中的Fisher笔记,顺便复习已经学过的模式识别,本文章将用SPSS来分析国赛数模2020C第二题,根据已有指标将给一些企业进行信用评级。笔者还是个菜鸡,如有错误欢迎指正。**注意:**可能是因为指标选取不当或方法不适合,正确率低于50%一、2020C题目国赛数模2020C题目,详情见CUMCM官网二、选取指标1.未归一化指标我需要根据202.原创 2021-08-10 17:39:46 · 6041 阅读 · 1 评论 -
元胞自动机与MATLAB实现笔记
文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言本文章将介绍元胞自动机的概念、组成、原理,并且用MATLAB实现奇偶规则和生命游戏等有趣的内容。一、pandas是什么?示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码如下(示例):import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seab.原创 2021-07-20 12:12:31 · 751 阅读 · 0 评论