自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(142)
  • 收藏
  • 关注

原创 Pointerformer: Deep Reinforced Multi-Pointer Transformer for the Traveling Salesman Problem阅读

这里,增强的上下文嵌入不仅包含有关实例本身和要访问的节点的信息,还包含有关已访问的节点的信息。最后,使用改进的REINFORCE 算法对所提出的 Pointerformer进行训练,该算法基于在策略梯度的共享基线上,同时统一一批实例的均值和方差。在文本片段中提到的“Enhanced Context Embedding”中使用了增强型的上下文嵌入,其中可能包括归一化层来确保每个节点的特征向量具有相同的尺度,这对于训练过程中的梯度下降和参数更新是有帮助的。是指在自然语言处理中,将文本数据转换为数值表示的过程。

2024-05-08 20:36:34 587

原创 《白话强化学习与python》笔记——第八章DQN 算法族

DQN算法。DQN,即Deep Q-Network,是一种结合了深度学习和Q学习的算法。

2024-04-14 20:59:13 701

原创 《白话强化学习与python》笔记——第七章Gym一一不要钱的试验场

总的来说,Gym为强化学习研究者和爱好者提供了一个功能强大且易于使用的实验平台。无论是学术研究还是个人兴趣,都可以通过Gym来探索和实践强化学习的最新进展。,它提供了一个标准化的接口来创建、管理和测试强化学习算法。Gym(全称为Gymnasium)是。

2024-04-14 20:39:16 258

原创 《白话强化学习与python》笔记——第六章深度学习(三)

为了解决这个问题,正则化被引入作为一种约束手段,通过在损失函数中添加一个与模型参数(权重)相关的惩罚项,来限制模型的复杂度。正则化的核心思想是在损失函数中加入一个与模型参数(权重)相关的项,这通常会导致模型参数的值更加接近于零,从而减少模型的复杂度。正则化是机器学习中一个重要的技术,它通过合理的数学原理和技巧,帮助模型在复杂的数据中找到平衡点,既能够捕捉数据的重要特征,又不至于陷入数据的局部细节和噪声中。正则化有助于模型在减小训练误差的同时,保持模型的简洁性,避免模型对训练数据过度拟合。

2024-04-14 12:09:50 929

原创 《白话强化学习与python》笔记——第六章深度学习(二)

LSTM的核心思想是在传统的RNN结构中引入了一个复杂的单元称为“记忆块”(memory block),该记忆块包含三个主要部分:输入门(input gate)、遗忘门(forget gate)和输出门(output gate)。与传统的神经网络不同,RNN能够利用内部的状态(记忆)来处理序列中的每一个元素,并把前面的信息传递到后续的计算中。这是CNN的核心组成部分,它使用一个小型的权重矩阵(称为卷积核或滤波器)来扫描整个输入体积并生成特征图(feature map),特征图表示特定特征的存在情况。

2024-04-04 21:30:10 1184

原创 《白话强化学习与python》笔记——第六章深度学习(一)

在一些浅层的神经网络架构中,线性回归可以被用作网络的最后一层,用于生成最终的预测输出。例如,在一个用于房价预测的网络中,最后一层可能是一个简单的线性回归层,它将前一层的非线性变换映射到最终的房价估计。

2024-04-04 19:45:37 936

原创 《白话强化学习与python》笔记——第五章时间分差

时间差分是一种用来估计一个策略的价值函数的方法,它结合了蒙特卡洛和动态规划算法的思想。时序差分方法和蒙特卡洛的相似之处在于可以从样本数据中学习,不需要事先知道环境;和动态规划的相似之处在于根据贝尔曼方程的思想,利用后续状态的价值估计来更新当前状态的价值估计。

2024-04-02 20:05:07 756

原创 电脑电池健康度查询

将路径中文件找到即可查看电池健康度。输入cmd,打开黑窗口。

2024-03-24 13:00:38 208

原创 npm镜像源配置

项目根目录的 .npmrc 的配置,优先级最高,且随着项目一起,可以免去因不同开发者的电脑的环境配置不同而导致的依赖下载异常的问题;实际开发中也推荐在根目录下配置一份,可以给每个项目配置不同的镜像,项目之间的配置互不影响。

2024-03-18 15:48:49 944

原创 《白话强化学习与python》笔记——第四章蒙特卡洛法

本章介绍的是蒙特卡罗法的估值方法与优化方法。蒙特卡罗法有很多可取之处,毕竟比起动态规划法,它不要求一个完整的Model(或者环境满足MDP),也就是说,它对环境的适应性更强。每一次Episode结束,蒙特卡罗法都会对每个状态的值进行估算。随着试探次数的增加,这个估值将越来越客观、准确。

2024-03-11 21:16:32 824

原创 《白话强化学习与python》笔记——第三章动态规划

在本章中,认识了动态规划。可以看出,这种方法的局限性还是非常明显的。我们已经反复强调,动态规划要求研究对象满足MDP,因此,在实际工作中,这种方法的应用并不广泛,我在编写程序的时候,一般也不使用动态规划的方法计算估值。作为一种非常典型的针对状态估值进行计算的方法,动态规划的思路是非常容易理解的。所以,将动态规划作为状态估值和策略优化的人门方法来学习,也是非常合适的。通过类似于递归求解的方式,逐层估算,如果每一层的估算都是准确的,就能迭代向上传递,把上面各层的各个状态的值估算准确。

2024-03-08 10:39:58 368

原创 《白话强化学习与python》笔记——第二章强化学习的脉络

用于预测环境中将发生什么的一套描述信息。

2024-03-07 21:32:10 808

原创 vue学习基础

作用:列表渲染,遍历容器的元素或者对象的属性语法: 2.v-bind作用:动态为HTML标签绑定属性值,如设置href,src,style样式等。语法:简化::属性名=“属性值”作用:这两类指令,都是用来控制元素的显示与隐藏的v-if语法:其它:可以配合 v-else-if / v-else 进行链式调用条件判断原理:基于条件判断,来控制创建或移除元素节点(条件渲染)场景:要么显示,要么不显示,不频繁切换的场景v-show语法:原理:基于CSS样式display来控制显示与隐藏场景

2024-02-19 12:25:33 186

原创 springboot-redis令牌主动失效机制

2.LoginInterceptor拦截器中,需要验证浏览器携带的令牌,并同时需要获取到redis中存储的与之相同的令牌。1.登录成功后,给浏览器响应令牌的同时,把该令牌存储到redis中.3.当用户修改密码成功后,删除redis中存储的旧令牌。

2024-02-03 13:06:35 383

原创 springboot集成redis

3.调用API(StringRedisTemplate)完成字符串的存取操作。1.导入spring-boot-start-data-redis起步依赖。2.在yml配置文件中配置redis连接信息。

2024-02-03 12:35:22 305

原创 validation自定义校验

2.自定义校验数据的类StateValidation实现ConstraintValidator接口。已有注解不能满足所有的校验要求,特殊的情况需要自定义校验。3.在需要校验的地方使用自定义注解。1.自定义注解State。

2024-02-01 12:17:33 244

原创 Validation分组校验

把校验项进行归类分组,在完成不同的功能时候,校验指定组中的校验项。2.定义校验项时指定分组。3.校验时要按校验的分组。

2024-01-29 13:37:23 250

原创 ThreadLocal,提供线程局部变量

使用ThreadLocal存储的数据。用来存取数据:set()/get()用完记得调用remove方法进行释放。

2024-01-25 14:40:05 344

原创 springboot登录认证JWT令牌

定义了一种简洁的、包含的格式,用于通信双方一json数据格式安全的传输信息。

2024-01-25 13:49:11 615

原创 spring自动配置的原理

的文件,当然,boot2.7以前的版本,读取的时spring.factories文件。3.实现selectImports方法这个方法层层调用,最终会读取。2.EnableAutoConfiguration注解又组合了。遵循约定大约配置的原则,在boot程序启动后,4.读取到全类名了之后,会解析注册条件。1.在主启动类上添加的。

2024-01-24 12:49:50 468

原创 spring ioc容器

ioc是 inversion of Control的简写,意为控制反转。通过其对所有的Java对象的实例化和初始化,控制对象与对象之间的依赖关系。(1)控制反转是一种思想。(2)控制反转是为了(3)控制反转,反转的是什么?答:将对象的创建权利交出去,交给第三方容器负责。将对象和对象之间关系的维护权交出去,交给第三方容器负责。(4)控制反转这种思想如何实现呢?

2024-01-16 18:35:54 422

原创 在DOS或Windows环境中,使用工具Debug

如果你使用的是不同的汇编开发环境,如MASM、NASM、TASM等,通常它们都提供了自己的调试工具或集成了调试功能,你可以根据特定工具的文档来学习如何在该工具中进行汇编代码的调试。请注意,Debug工具是一个相对古老的工具,可能不支持一些现代的功能,但它仍然可以用于简单的汇编代码调试。如果你使用的是其他汇编调试器,步骤会有所不同,但基本的调试原则是相似的。如果程序在执行期间出现错误或你想查看某个特定位置的变量值,可以使用 p 命令查看寄存器和内存中的数据。你的代码会一步一步执行,显示每一行代码的执行情况。

2023-10-28 21:28:10 588

原创 Mybatis学习(实现增删改查)

【代码】Mybatis学习(实现增删改查)

2022-11-22 21:03:38 540 1

原创 各个webXML的配置

【代码】各个webXML的配置。

2022-11-22 20:56:57 195

原创 用DOSBox0.74进行汇编代码的运行

这样就成功了同时还会生成一个.obj文件,如果有错误的话,按照错误的提示,进行相应的修改。首先在那个文件夹里创建一个hello.asm文件,然后写上相应的代码保存。首先将你的所有东西都写入一个文件中。就会看到文件与你电脑上的文件相同。将其与box中的c盘连接。这是连接,要写程序的话。再打开你的box输入。

2022-10-31 16:26:57 714

原创 服务器内部转发以及客户端重定向,保存作用域问题

一次请求响应过程,对于客户端而言,内部经过了多少次转发,客户端是不知道的。两次请求响应的过程。客户端肯定知道请求URL有变化。

2022-10-21 19:58:44 253

原创 会话跟踪技术

2.下一次客户端给服务器发请求的时候,会把sessionID带给服务器,那么服务器就能获取到了,那么服务器就判断这一次请求和上一次请求是同一个客户端从而能够区分客户端。1.Http是无状态的,服务器无法判断两次请求是同一个客户端发过来的,还是不同的客户端发过来的所以通过会话跟踪技术来解决这一问题。1.客户第一次发送请求给服务器,服务器获取session,若获取不到,则创建新的然后相应给客户端。session保存作用域是和具体的某一个session对应的。

2022-10-21 19:26:44 165

原创 Java中数据库连接的方法,以及代码演示

1.导入jar包一般可以在百度直接搜索可以找到,如果对版本有要求的话进行相应版本的搜索,我这里是8.0.16版本的此时会抛出一个异常,可以根据idea的提示将其抛出。3.通过驱动管理器获取连接对象注意url中要带参数的话用?进行连接,连接第二个参数时使用&连接,在这里我已经将其乱码问题解决,大家可以放心使用,用户名称和密码根据自己设置的自行修改。6.执行更新(增删改),返回影响的行数7.释放资源(关闭链接,先关闭psmt,再关闭conn)

2022-10-18 17:10:26 1772

原创 死锁问题的产生以及解决办法

线程死锁是指由于两个或者多个线程互相持有对方所需要的资源,导致这些线程处于等待状态,无法前往执行。当线程进入对象的 synchronized 代码块时,便占有了资源,直到它退出该代码块或者调用 wait 方法,才释放资源,在此期间,其他线程将不能进入该代码块。当线程互相持有对方所需要的资源时,会互相等待对方释放资源,如果线程都不主动释放所占有的资源,将产生死锁。

2022-10-14 18:09:30 830

原创 将window上面的文字复制到虚拟机里

将window文字复制到虚拟机里

2022-09-20 08:53:13 1322

原创 gcc编译器

gcc编译器能将c/c++语言、汇编程序编译、链接成可执行文件。

2022-08-05 10:15:30 278

原创 vim编译器的使用

三种模式:命令模式,输入模式,底线模式。

2022-08-05 10:06:47 616

原创 Linux常用命令

su用于用户之间的切换,但是切换前的用户依然保持登录状态,如果是root向普通或虚拟用户切换不需要密码,反之普通用户切换到其它任何用户都需要密码验证。locate/etc/sh搜索etc目录下以sh开头的文件(路径中含/etc/sh的)find/tmp-name'a*'查找/tmp目录下所有以a开头的文件或目录.如果数据库中没有查询的。find/root/-perm600查找/root/目录下权限为600的文件。which命令的作用是在PATH变量指定的路径中,搜索某个系统命令的位置,...

2022-08-01 11:07:45 1780

原创 JavaScript 异步编程

异步(Asynchronous, async)是与同步(Synchronous, sync)相对的概念。在我们学习的传统单线程编程中,程序的运行是同步的(同步不意味着所有步骤同时运行,而是指步骤在一个控制流序列中按顺序执行)。而异步的概念则是不保证同步的概念,也就是说,一个异步过程的执行将不再与原有的序列有顺序关系。简单来理解就是:同步按你的代码顺序执行,异步不按照代码顺序执行,异步的执行效率更高。以上是关于异步的概念的解释,接下来我们通俗地解释一下异步:异步就是从主线程发射一个子线程来完成任务。在前端编程

2022-06-03 11:23:41 89

原创 JavaScript JSON

JSON是用于存储和传输数据的格式,通常用于服务端向网页传递数据数据为 键/值 对。数据由逗号分隔。大括号保存对象方括号保存数组一个名称对应一个值JSON数据格式为键值对,就像javaSc对象的属性。键/值对包括字段名称(在双引号中),后面一个冒号,然后是值:(2)JSON对象其保存在大括号内就像javascript中对象可以保存多个键/值对(3)JSON数组其保存在中括号内。数组可以包含对象:2.字符串转换为Javascript对象通常我们从服务器中读取JSON数据,并在网页中显示数

2022-06-03 10:35:21 112

原创 javascript表单验证

js可以用来在数据被送往服务器前对HTML表单中的这些数据进行验证运行结果:email验证;

2022-06-03 10:03:16 81

原创 HTML DOM Document 对象

HTML DOM 节点在HTML DOM(Doucinmet Object Model)中每一个元素都是节点注意: 该属性是只读的。提示: 为元素设置焦点,可以使用 element.focus() 方法。提示:可以使用 document.hasFocus() 方法来查看当前元素是否获取焦点。例如:2.addEventListener() 方法用于向文档添加事件句柄提示:可以使用document.removeEventListener()方法来移除其添加的事件句柄提示:也可以使用 element.

2022-06-02 22:49:04 122

原创 JavaScript 事件

HTML 事件HTML 事件可以是浏览器行为,也可以是用户行为。以下是 HTML 事件的实例:在事件触发时 JavaScript 可以执行一些代码。HTML 元素中可以添加事件属性,使用 JavaScript 代码来添加 HTML 元素。常见的事件:事件 描述onchange HTML 元素改变onclick 用户点击 HTML 元素onmouseover 鼠标指针移动到指定的元素上时发生onmouseout 用户从一个 HTML 元素上移开鼠标时发生onkeydown 用户按下键盘按键on

2022-06-02 12:38:14 105

原创 JavaScript 错误 - throw、try 和 catch

try 语句测试代码块的错误catch 语句处理错误throw语句创建自定义错误fianlly 语句在try 和 catch语句之后,无论是否触发异常,该语句都会执行当错误发生时,当事情出问题时,JavaScript 引擎通常会停止,并生成一个错误消息。描述这种情况的技术术语是:JavaScript 将抛出一个错误。try语句允许我们定义在执行时进行错误测试的代码块catch语句允许我们在定义try代码块发生错误时,所执行的代码块语法:例如:结果:finally语句finally语句不论

2022-06-02 12:15:11 210

原创 js中的正则表达式

正则表达式(英语:Regular Expression,在代码中常简写为regex、regexp或RE)使用单个字符串来描述、匹配一系列符合某个句法规则的字符串搜索模式。搜索模式可用于文本搜索和文本替换。正则表达式是由一个字符序列形成的搜索模式当在文本中搜索数据时,可以用搜索模式来描述你要查询的内容正则表达式可以用于所有文本搜索和文本替换的操作例如:实例解析:/runoob/i 是一个正则表达式。runoob 是一个正则表达式主体 (用于检索)。i 是一个修饰符 (搜索不区分大小写)。在 J

2022-06-02 12:00:06 93

交换机工作原理分析实验2报告

(1) 能够在Packet Tracer软件中完成直连网络环境的搭建与配置。 (2) 理解共享式以太网和交换式以太网的区别。 (3) 理解交换机通过自学习建立MAC地址转发表的过程以及交换机对不同数据帧的处理过程。 (4) 理解生成树协议的作用,能够分析生成树协议的工作过程。 (5) 理解VLAN对广播域的隔离作用。

2022-11-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除