自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 问答 (1)
  • 收藏
  • 关注

原创 深度强化学习DDPG实现路径跟踪(局部规划器)方法讲解与PyTorch代码实现

DDPG是一种Actor-Critic方法,它有一个策略网络(演员),一个价值网络(评委)。策略网络(Actor)控制智能体做运动,它基于状态sss做出动作aaa,记为μs\mu(s)μs,输入连续的状态空间,输出每一个动作的确定值。价值网络(Critic)不控制智能体,只是基于状态sss给动作aaa打分,记为qsaq(s,a)qsa,输入连续的状态+动作,输出评分,从而指导策略网络做出改进。在PyTorch代码实现中,我们可以用简单的。

2024-05-24 16:08:52 998

原创 题解 CF1954D Colored Balls

对于单个set方案,每次分group时,如果有不同颜色可以把两个球分到同一个group,如果只剩一个颜色则只能一个球一个group。那么最优的分法是每次数量最少的球和数量最多的球分同一个group,直到分完或者分到只剩一种颜色的球,如果只剩一种颜色则这些球每一个成一个group。由于排过序,遍历到的时候保证是set中数量最多的颜色的球的数量,则每一次访问一个状态要对结果加上。种,我们不可能一个一个枚举,这种涉及到求方案数的题可以考虑DP。是方案里数量最多的颜色的球的数量,一种可行的状态转移函数是,

2024-04-19 19:34:36 588 1

原创 ANYA:一种最优任意角度在线2D寻路算法(论文解读+伪代码)

ANYA算法是一种用于任意角度路径规划的算法。ANYA算法的关键优势在于其能够在线处理查询,即不需要预先的数据处理步骤,且始终能够找到最优路径。经典的任意角度路径规划算法有Theta*等,相比A*等算法,它们规划出来的路径角度不受地图的栅格限制,而且路径长度通常更短,很适合用于机器人和游戏中的路径规划,详情请参考维基百科。传统的路径规划方法通常只考虑栅格上的离散点,并通过后处理步骤来优化路径长度和外观。然而,这些方法存在一些局限性:它们通常只能产生近似最短路径,并且在计算上更为复杂。

2024-01-30 16:57:18 980

原创 RVSC右心室分割挑战-UNet注意力,UNet++,U2Net实现

如果对你有帮助可以给个小星星哦~。RVSC原始资料(含介绍,数据集,matlab评测程序等)下载地址:链接:提取码: yx13RVSC数据集(仅含数据集,不含其它资料,已整理好,可以直接运行预处理)下载地址:链接:提取码: 6h2i本文不讲解模型原理,只介绍实验过程,如有需要可在网上搜索其它文章学习。

2024-01-27 14:59:51 1311 9

原创 qemu源码configure配置出错scripts/symlink-install-tree.py

将scripts/symlink-install-tree.py修改为如下代码即可解决问题。

2024-01-15 18:03:23 507

原创 《智能系统》课程实验-产生式系统推理

正向推理是最复杂的,因为它可能会出现自相矛盾的事实。比如在老虎的特征之上再加上“会飞”,出现了一个规则库中不存在的生物体,对此,我们只能输出组合结论“会飞的老虎”。写完代码后,我给助教老师检查了两次。反向推理以及规则的增删改没有什么问题,就只有正向推理出问题。第一次在老虎的特征基础上加上“会飞”特征,我的程序推导出“老虎”,但现实中显然不存在有“会飞”特征的“老虎”,我的算法需要修改。第二次给助教老师检查,我使用了“概率”或“特征符合率”来描述推导出最优结论与特征的符合率。

2024-01-06 01:29:41 1018

原创 强化学习课程知识点总结

本总结是本人复习《强化学习》课程,准备其考试时自己手打的总结。不保证系统性、准确性和时效性,仅用于应试,因追求精简而省略了很多内容,如需系统学习请使用正式教材。CH1 介绍1.1 RL问题描述观点1 强化学习就是学习“做什么”才能使得数值化的收益最大化。观点2 强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。特点没有监督者,只有收益信号延时收益数据是按时间连续的,不独立同分布智能体的行动有长期效应,会影响之后接收的数据1.2 RL基本概念1.2.1

2024-01-06 01:27:08 580

原创 LLM微调实现特定任务(以CHIP2021-Task3中文临床术语标准化任务为例)

临床术语标准化任务是医学数据统计分析中不可或缺的一项任务。临床上,关于同一种诊断、手术、药品、检查、化验、症状等往往会有成百上千种不同的写法。标准化(归一)要解决的问题就是为临床上各种不同说法找到对应的标准说法。有了术语标准化的基础,研究人员才可对电子病历进行后续的统计分析。本质上,临床术语标准化任务也是语义相似度匹配任务的一种。但是由于原词表述方式过于多样,单一的匹配模型很难获得很好的效果。

2023-12-05 00:43:09 526 2

原创 2021年ICPC第九届陕西省赛题解(10/12)

先发着,其余题目待补。

2022-08-25 13:26:29 1558 1

原创 第k个格雷码为k xor (k>>1)的简单理解证明

大神没有给出详细的证明,评论区也没看到证明,我在网上也找不到证明,于是自己证了一波(不会是前无古人吧,但我真的找不到其他人的证明了,百科上甚至没有这个结论,如果有前人的证明请告诉我,我信息检索能力不太行QWQ),并且给出一种可能的推出这个结论的思路(当然蒟蒻没有看到结论之前是想不出的QWQ)。如果k的最低位为0,则k+1最低位为1,没有产生进位,此时要使式子只有一位为1,将k和k+1异或即可,我们假设不知道这个结论,我们寻找一种结论来用k表示Gk。如果k的最低位为1,则k+1最低位为0,此时发生了进位。..

2022-08-02 22:50:17 665 3

原创 Codeforces 1249E By Elevator or Stairs?最简单题解

每次更新完f[i],也要更新一下mb,使得最后一次坐电梯时间总是最小的。要求f[i],我们就求最后一次是走楼梯或是坐电梯的最小时间。f[i-1]+a[i]就是最后一次是走楼梯的最小时间。虽然说可以往下走,但易证要求最短时间肯定只能往上走。mb+b[i]表示最后一次是坐电梯的最小时间。f[i]表示答案,即到每个楼层最短时间。...

2022-07-20 10:21:59 531

原创 因路径乱码使InstallShield Wizard安装包打开“出现1155错误,文件xxx.msi未找到“的解决方式

我遇到的错误如下图:之前改过日文系统,现在出现路径乱码,使得.exe安装包无法正常运行。上网针对InstallShield搜索,也查不到相关解决方法。于是改变思路,想着怎么去掉这个乱码,又继续上网搜索。琢磨了两个小时,发现把控制面板→区域→区域设置里的Beta版的√去掉就好了,乱码没了。...

2022-04-19 17:42:14 3561 7

原创 将其它进制整数转换为对称三进制数的算法(用1/0/-1表示,可应用在三进制计算机上)

对称三进制数的对称即相反数的一致性,因此它就和二进制代码不同,不存在无符号数的概念。这样,三进制计算机的架构也要简单、稳定、经济得多。其指令系统也更便于阅读,而且非常高效。在一般情况下,命题不一定为真或假,还可能为未知。在三进制逻辑学中,符号1代表真;符号-1代表假;符号0代表未知。本文章中,为了方便表示,我们用符号’-'表示-1。以下代码中,Ternary(int x)函数是算法的关键代码。定义Ternary类:class Ternary{private: char num[25];//数字

2022-02-27 18:20:44 688

原创 C++实现复数类complex以“a+bi“形式的读入与输出

主要是因为STL自带的complex类不支持按这种方式读入,又不想重新写一遍整个类,于是就写了这个读入函数。有BUG欢迎反馈

2022-02-16 15:40:51 1397

原创 有理数类的一种实现

int gcd(int x, int y){ return x%y?gcd(y,x%y):y;}struct rational{ int numerator,denominator; rational(){ initialization(); } rational(int _numerator){ numerator = _numerator; denominator = 1; } rational(int _numerator, int _denominator

2022-02-10 18:16:08 208

原创 利用矩阵判断二元关系的传递性的简易方法

有任何问题欢迎指出。参考教材:离散数学及其应用Discrete Mathematics and its Applycations the Eighth Edition by Kenneth H.Rosen

2021-11-09 12:34:45 1852

原创 对SG函数(Sprague-Garundy函数)及其应用的简单解释与证明

前置知识:Nim博弈(还没接触过的可以顺便学一学把模板题做了)参考文章:博弈论 SG函数(需要更详细的解释的可去此处)正文:提出问题:给定多个有向无环图,每个图有一个起始顶点,起始顶点上有一枚棋子,两名选手交替地选择一个图将其上的那枚棋子沿有向边进行移动,无法移动者判负。接下来分析一个图的情况:首先定义mex(minimal excludant)运算,这是施加于一个集合的运算,表示最小的不属于这个集合的非负整数。例如mex{0,1,2,4}=3、mex{2,3,5}=0、mex{}=0。对于一个

2021-11-09 00:33:19 343 2

原创 图论-链式前向星-删边操作

其实这个东西,如果已经理解链式前向星存边了的话应该都想的出来。如果还不理解链式前向星还是先学吧。struct edge{ int fr,to,top,bot;//fr为起点, to为终点, top为边集栈中该边上方一边, bot为边集栈中该边下方一边 }e[2000005]; int head[2005],ecnt=0; inline void add_edge(int u, int v){ ...

2019-11-09 20:36:51 1657 3

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除