自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(151)
  • 收藏
  • 关注

原创 DeepACO: Neural-enhanced Ant Systems for Combinatorial Optimization代码阅读

用于训练模型,创建神经网络模型,创建优化器,加载验证集数据,创建动画器,在训练开始前进行一次验证,将验证结果保存到列表中,记录训练总时间,开始训练,进行一次训练,记录训练时间,进行一次验证,将验证结果保存到列表中,输出训练总时间,输出每个epoch的验证结果,保存训练好的模型。首先,将模型设置为评估模式,获取启发式向量,创建ACO对象,进行采样,运行ACO算法,计算基线,获取采样成本的最小值和ACO算法的最小成本,返回结果。:用于训练一个epoch,遍历每个step,生成随机实例,生成图数据,训练实例。

2024-07-20 11:48:17 502

原创 张量不是张亮

在深度学习和机器学习中,张量(Tensor)是一种多维数组,是数据的基本单位。张量是PyTorch和其他深度学习框架(如TensorFlow)中的核心数据结构。

2024-07-15 15:50:39 176

原创 IEEE TETCI | GPBT: 基于种群的强化学习超参优化的学习

超参数优化是在机器学习和深度学习中非常重要的一个环节。超参数是在模型训练之前就需要设定的参数,它们不能通过训练过程自动学习得到,例如学习率、层数、节点数、正则化参数等。常见的超参数优化方法包括手动搜索、随机搜索、网格搜索、基于梯度的优化方法(如贝叶斯优化)等。手动搜索依赖于经验和直觉,效率较低但在简单情况下可能有效。随机搜索和网格搜索则是较为简单直接的方法,通过尝试不同的超参数组合来找到较优的结果。

2024-07-10 10:24:38 147

原创 详解背包问题

背包问题(Knapsack problem)是一种组合优化的 NP 完全问题。它可以描述为:给定一组物品,每种物品都有自己的重量和价格(或价值),在限定的总重量内,如何选择物品,才能使得物品的总价格(或总价值)最高。问题的名称来源于如何选择最合适的物品放置于给定背包中。∑j1n​pj​xj​∑j1n​wj​xj​≤Wnxj​jwj​jpj​jWjbj​各类复杂的背包问题总可以变换为简单的 0-1 背包问题进行求解。

2024-07-09 16:07:52 984

原创 遗传算法求解TSP

遗传算法求解旅行商问题(TSP)的一般步骤如下:重复步骤 3 - 6 ,直到满足终止条件(如达到预定的迭代次数或找到满意的解)。通过不断迭代,种群中的染色体逐渐优化,最终得到较优的 TSP 路径。需要注意的是,遗传算法的参数(如种群大小、交叉概率、变异概率等)需要根据具体问题进行调整和优化,以获得更好的求解效果。

2024-07-07 15:23:58 336

原创 Embedding理解

Embedding 可以理解为一种将概念、物体或信息转换为数字序列的数值表示方法。它是沟通两个不同世界或领域的桥梁,能够把各种类型的数据(如文本、图像、视频等)映射到一个向量空间中。在这个向量空间里,相似的项目(例如语义上相近的单词、相似的图像或相关的视频内容等)会被映射到相近的位置。通过这种方式,计算机可以更好地理解和处理这些数据。以文本 Embedding 为例,它将离散的文字信息(如单词、句子、文档)转换成连续的向量数据。这样,语义相似的词在向量空间中位置相近,并且通过高维度捕捉语言的复杂性。

2024-07-07 15:06:36 610

原创 演化计算的学习

演化计算是一种基于生物进化原理的计算方法,旨在通过模拟自然选择、遗传变异和繁殖等生物进化过程来解决复杂的优化问题。它主要包括遗传算法、进化策略和遗传编程等。遗传算法通过对染色体(解的编码)的操作,如选择、交叉和变异,来逐步搜索最优解;进化策略侧重于对个体的策略参数进行调整;遗传编程则能够自动生成解决问题的程序结构。演化计算具有以下优点:不需要问题的导数等先验知识,适用于难以建立数学模型的问题。能够同时处理多个解,具有较好的全局搜索能力。具有较强的鲁棒性和适应性。

2024-07-07 14:51:40 421

原创 差分进化算法

差分进化(DE)是一种算法,通过创建一些随机个体,将它们与预定义的评估指标进行比较,并保留最好的个体,然后通过混合剩余个体的特征来创建新的个体,并重复这个过程来解决全局优化问题。在接下来的编码中,向大家仔细地解释这个过程。

2024-07-07 14:28:36 405

原创 蚁群算法求解TSP问题

一只蚂蚁从一个城市出发,在访问其他城市时留下信息素踪迹。其他蚂蚁沿着这些踪迹并开辟自己的路径。信息素在访问频率较高的路径上积累得更密集,这种密度增加了其他蚂蚁选择该路径的可能性。1' -> 'mapstr在没有蒸发的情况下:局部最优问题:信息素路径不断增加,使得特定路径极其强大。这可能会导致算法不断探索这条路径,而忽略其他可能的更好解决方案。灵活性较差:发现新途径可能会变得困难。蒸发通过减少不太喜欢的路径的信息素痕迹来鼓励新路径的发现。缺乏蒸发可能会导致算法卡在现有路径上。

2024-06-26 21:33:03 391

原创 Pointerformer: Deep Reinforced Multi-Pointer Transformer for the Traveling Salesman Problem阅读

这里,增强的上下文嵌入不仅包含有关实例本身和要访问的节点的信息,还包含有关已访问的节点的信息。最后,使用改进的REINFORCE 算法对所提出的 Pointerformer进行训练,该算法基于在策略梯度的共享基线上,同时统一一批实例的均值和方差。在文本片段中提到的“Enhanced Context Embedding”中使用了增强型的上下文嵌入,其中可能包括归一化层来确保每个节点的特征向量具有相同的尺度,这对于训练过程中的梯度下降和参数更新是有帮助的。是指在自然语言处理中,将文本数据转换为数值表示的过程。

2024-05-08 20:36:34 617

原创 《白话强化学习与python》笔记——第八章DQN 算法族

DQN算法。DQN,即Deep Q-Network,是一种结合了深度学习和Q学习的算法。

2024-04-14 20:59:13 725

原创 《白话强化学习与python》笔记——第七章Gym一一不要钱的试验场

总的来说,Gym为强化学习研究者和爱好者提供了一个功能强大且易于使用的实验平台。无论是学术研究还是个人兴趣,都可以通过Gym来探索和实践强化学习的最新进展。,它提供了一个标准化的接口来创建、管理和测试强化学习算法。Gym(全称为Gymnasium)是。

2024-04-14 20:39:16 308

原创 《白话强化学习与python》笔记——第六章深度学习(三)

为了解决这个问题,正则化被引入作为一种约束手段,通过在损失函数中添加一个与模型参数(权重)相关的惩罚项,来限制模型的复杂度。正则化的核心思想是在损失函数中加入一个与模型参数(权重)相关的项,这通常会导致模型参数的值更加接近于零,从而减少模型的复杂度。正则化是机器学习中一个重要的技术,它通过合理的数学原理和技巧,帮助模型在复杂的数据中找到平衡点,既能够捕捉数据的重要特征,又不至于陷入数据的局部细节和噪声中。正则化有助于模型在减小训练误差的同时,保持模型的简洁性,避免模型对训练数据过度拟合。

2024-04-14 12:09:50 940

原创 《白话强化学习与python》笔记——第六章深度学习(二)

LSTM的核心思想是在传统的RNN结构中引入了一个复杂的单元称为“记忆块”(memory block),该记忆块包含三个主要部分:输入门(input gate)、遗忘门(forget gate)和输出门(output gate)。与传统的神经网络不同,RNN能够利用内部的状态(记忆)来处理序列中的每一个元素,并把前面的信息传递到后续的计算中。这是CNN的核心组成部分,它使用一个小型的权重矩阵(称为卷积核或滤波器)来扫描整个输入体积并生成特征图(feature map),特征图表示特定特征的存在情况。

2024-04-04 21:30:10 1195

原创 《白话强化学习与python》笔记——第六章深度学习(一)

在一些浅层的神经网络架构中,线性回归可以被用作网络的最后一层,用于生成最终的预测输出。例如,在一个用于房价预测的网络中,最后一层可能是一个简单的线性回归层,它将前一层的非线性变换映射到最终的房价估计。

2024-04-04 19:45:37 954

原创 《白话强化学习与python》笔记——第五章时间分差

时间差分是一种用来估计一个策略的价值函数的方法,它结合了蒙特卡洛和动态规划算法的思想。时序差分方法和蒙特卡洛的相似之处在于可以从样本数据中学习,不需要事先知道环境;和动态规划的相似之处在于根据贝尔曼方程的思想,利用后续状态的价值估计来更新当前状态的价值估计。

2024-04-02 20:05:07 768

原创 电脑电池健康度查询

将路径中文件找到即可查看电池健康度。输入cmd,打开黑窗口。

2024-03-24 13:00:38 291

原创 npm镜像源配置

项目根目录的 .npmrc 的配置,优先级最高,且随着项目一起,可以免去因不同开发者的电脑的环境配置不同而导致的依赖下载异常的问题;实际开发中也推荐在根目录下配置一份,可以给每个项目配置不同的镜像,项目之间的配置互不影响。

2024-03-18 15:48:49 1033

原创 《白话强化学习与python》笔记——第四章蒙特卡洛法

本章介绍的是蒙特卡罗法的估值方法与优化方法。蒙特卡罗法有很多可取之处,毕竟比起动态规划法,它不要求一个完整的Model(或者环境满足MDP),也就是说,它对环境的适应性更强。每一次Episode结束,蒙特卡罗法都会对每个状态的值进行估算。随着试探次数的增加,这个估值将越来越客观、准确。

2024-03-11 21:16:32 844

原创 《白话强化学习与python》笔记——第三章动态规划

在本章中,认识了动态规划。可以看出,这种方法的局限性还是非常明显的。我们已经反复强调,动态规划要求研究对象满足MDP,因此,在实际工作中,这种方法的应用并不广泛,我在编写程序的时候,一般也不使用动态规划的方法计算估值。作为一种非常典型的针对状态估值进行计算的方法,动态规划的思路是非常容易理解的。所以,将动态规划作为状态估值和策略优化的人门方法来学习,也是非常合适的。通过类似于递归求解的方式,逐层估算,如果每一层的估算都是准确的,就能迭代向上传递,把上面各层的各个状态的值估算准确。

2024-03-08 10:39:58 380

原创 《白话强化学习与python》笔记——第二章强化学习的脉络

用于预测环境中将发生什么的一套描述信息。

2024-03-07 21:32:10 825

原创 vue学习基础

作用:列表渲染,遍历容器的元素或者对象的属性语法: 2.v-bind作用:动态为HTML标签绑定属性值,如设置href,src,style样式等。语法:简化::属性名=“属性值”作用:这两类指令,都是用来控制元素的显示与隐藏的v-if语法:其它:可以配合 v-else-if / v-else 进行链式调用条件判断原理:基于条件判断,来控制创建或移除元素节点(条件渲染)场景:要么显示,要么不显示,不频繁切换的场景v-show语法:原理:基于CSS样式display来控制显示与隐藏场景

2024-02-19 12:25:33 192

原创 springboot-redis令牌主动失效机制

2.LoginInterceptor拦截器中,需要验证浏览器携带的令牌,并同时需要获取到redis中存储的与之相同的令牌。1.登录成功后,给浏览器响应令牌的同时,把该令牌存储到redis中.3.当用户修改密码成功后,删除redis中存储的旧令牌。

2024-02-03 13:06:35 396

原创 springboot集成redis

3.调用API(StringRedisTemplate)完成字符串的存取操作。1.导入spring-boot-start-data-redis起步依赖。2.在yml配置文件中配置redis连接信息。

2024-02-03 12:35:22 307

原创 validation自定义校验

2.自定义校验数据的类StateValidation实现ConstraintValidator接口。已有注解不能满足所有的校验要求,特殊的情况需要自定义校验。3.在需要校验的地方使用自定义注解。1.自定义注解State。

2024-02-01 12:17:33 266

原创 Validation分组校验

把校验项进行归类分组,在完成不同的功能时候,校验指定组中的校验项。2.定义校验项时指定分组。3.校验时要按校验的分组。

2024-01-29 13:37:23 285

原创 ThreadLocal,提供线程局部变量

使用ThreadLocal存储的数据。用来存取数据:set()/get()用完记得调用remove方法进行释放。

2024-01-25 14:40:05 346

原创 springboot登录认证JWT令牌

定义了一种简洁的、包含的格式,用于通信双方一json数据格式安全的传输信息。

2024-01-25 13:49:11 629

原创 spring自动配置的原理

的文件,当然,boot2.7以前的版本,读取的时spring.factories文件。3.实现selectImports方法这个方法层层调用,最终会读取。2.EnableAutoConfiguration注解又组合了。遵循约定大约配置的原则,在boot程序启动后,4.读取到全类名了之后,会解析注册条件。1.在主启动类上添加的。

2024-01-24 12:49:50 471

原创 spring ioc容器

ioc是 inversion of Control的简写,意为控制反转。通过其对所有的Java对象的实例化和初始化,控制对象与对象之间的依赖关系。(1)控制反转是一种思想。(2)控制反转是为了(3)控制反转,反转的是什么?答:将对象的创建权利交出去,交给第三方容器负责。将对象和对象之间关系的维护权交出去,交给第三方容器负责。(4)控制反转这种思想如何实现呢?

2024-01-16 18:35:54 425

原创 在DOS或Windows环境中,使用工具Debug

如果你使用的是不同的汇编开发环境,如MASM、NASM、TASM等,通常它们都提供了自己的调试工具或集成了调试功能,你可以根据特定工具的文档来学习如何在该工具中进行汇编代码的调试。请注意,Debug工具是一个相对古老的工具,可能不支持一些现代的功能,但它仍然可以用于简单的汇编代码调试。如果你使用的是其他汇编调试器,步骤会有所不同,但基本的调试原则是相似的。如果程序在执行期间出现错误或你想查看某个特定位置的变量值,可以使用 p 命令查看寄存器和内存中的数据。你的代码会一步一步执行,显示每一行代码的执行情况。

2023-10-28 21:28:10 711

原创 Mybatis学习(实现增删改查)

【代码】Mybatis学习(实现增删改查)

2022-11-22 21:03:38 546 1

原创 各个webXML的配置

【代码】各个webXML的配置。

2022-11-22 20:56:57 197

原创 用DOSBox0.74进行汇编代码的运行

这样就成功了同时还会生成一个.obj文件,如果有错误的话,按照错误的提示,进行相应的修改。首先在那个文件夹里创建一个hello.asm文件,然后写上相应的代码保存。首先将你的所有东西都写入一个文件中。就会看到文件与你电脑上的文件相同。将其与box中的c盘连接。这是连接,要写程序的话。再打开你的box输入。

2022-10-31 16:26:57 732

原创 服务器内部转发以及客户端重定向,保存作用域问题

一次请求响应过程,对于客户端而言,内部经过了多少次转发,客户端是不知道的。两次请求响应的过程。客户端肯定知道请求URL有变化。

2022-10-21 19:58:44 260

原创 会话跟踪技术

2.下一次客户端给服务器发请求的时候,会把sessionID带给服务器,那么服务器就能获取到了,那么服务器就判断这一次请求和上一次请求是同一个客户端从而能够区分客户端。1.Http是无状态的,服务器无法判断两次请求是同一个客户端发过来的,还是不同的客户端发过来的所以通过会话跟踪技术来解决这一问题。1.客户第一次发送请求给服务器,服务器获取session,若获取不到,则创建新的然后相应给客户端。session保存作用域是和具体的某一个session对应的。

2022-10-21 19:26:44 169

原创 Java中数据库连接的方法,以及代码演示

1.导入jar包一般可以在百度直接搜索可以找到,如果对版本有要求的话进行相应版本的搜索,我这里是8.0.16版本的此时会抛出一个异常,可以根据idea的提示将其抛出。3.通过驱动管理器获取连接对象注意url中要带参数的话用?进行连接,连接第二个参数时使用&连接,在这里我已经将其乱码问题解决,大家可以放心使用,用户名称和密码根据自己设置的自行修改。6.执行更新(增删改),返回影响的行数7.释放资源(关闭链接,先关闭psmt,再关闭conn)

2022-10-18 17:10:26 1810

原创 死锁问题的产生以及解决办法

线程死锁是指由于两个或者多个线程互相持有对方所需要的资源,导致这些线程处于等待状态,无法前往执行。当线程进入对象的 synchronized 代码块时,便占有了资源,直到它退出该代码块或者调用 wait 方法,才释放资源,在此期间,其他线程将不能进入该代码块。当线程互相持有对方所需要的资源时,会互相等待对方释放资源,如果线程都不主动释放所占有的资源,将产生死锁。

2022-10-14 18:09:30 835

原创 将window上面的文字复制到虚拟机里

将window文字复制到虚拟机里

2022-09-20 08:53:13 1366

原创 gcc编译器

gcc编译器能将c/c++语言、汇编程序编译、链接成可执行文件。

2022-08-05 10:15:30 281

交换机工作原理分析实验2报告

(1) 能够在Packet Tracer软件中完成直连网络环境的搭建与配置。 (2) 理解共享式以太网和交换式以太网的区别。 (3) 理解交换机通过自学习建立MAC地址转发表的过程以及交换机对不同数据帧的处理过程。 (4) 理解生成树协议的作用,能够分析生成树协议的工作过程。 (5) 理解VLAN对广播域的隔离作用。

2022-11-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除