沈夢昂志-CSDN博客

原创深度强化学习（DRL）中的Policy-based 和 Value-based

基于价值（Value-based）和基于策略（Policy-based）的方法都有一个共同的目标，即最大化累积回报，但它们在实现这一目标的方式上有所不同。value-based 通过估计每个状态-动作对的 Q 值来选择动作。即最大化Q值选择动作。但是为了平衡探索（exploration）和利用（exploitation）。常常会通过贪心策略进行平衡。即以ϵ 的概率：选择一个随机动作。1−ϵ 的概率：选择当前 Q 值最大的动作。

2024-07-19 10:02:47 316

原创 Overleaf导出的PDF，如何在WORD中使用

最近在写论文，然后用到了Overleaf写伪代码。但是生成的伪代码只有PDF格式，我写的论文是在WORD中，因此我需要将在PDF中的伪代码转化成WORD。首先我需要创建一个TEX后缀的文件，随便创建一个txt文件，将其后缀改成tex就行。其中a.tex是你要转化的文件名，a.docx是你要得到的文件。点击下载，这里更推荐msi，如果是zip则需要配置环境。黑框中输入pandoc a.tex -o a.docx。转化，首先需要进入到你要转化的文件目录，以我的为例。有输出则代表安装成功。

2024-07-10 20:56:09 388

原创 gazebo 报错整理__如何导入自定义地图plaza

在打开world(地图)文件后，有一个load model模块。但我并不知道这个，地图文件在哪。或者说我应该如何修改，地图文件。即我们能自己定义一个地图，载入到gazebo。再次我们在主目录下使用Ctrl+h 打开隐藏文件。找到.gazebo/models/turtlebot3_plaza。在gitclone完turtlebot3文件后。我们可以看到如下目录。在里面加入sdf模型。就可以在gazebo中载入了。最近在用turtlebot3做路径规划仿真。将模型添加到指定的路径，后。

2024-05-30 20:14:55 354

原创已安装CUDA与Pytorch但torch.cuda.is_available()为False

我之前一直用的cuda11.8。今天在github上，gitclone了一个代码需要Tested with ROS Noetic on Ubuntu 20.04 with python 3.8.10 and pytorch 1.10。然后我按照要求下载了pytorch。但是最后发现cuda不能使用。但是输入torch.cuda.is_available()。我们可以看到我们是有cuda和pytorch的。我进行安装后版本也对应上了。然后重启电脑就解决了。

2024-05-29 14:41:57 381

原创机器人领域顶刊顶会记录

国际期刊Robotica国际会议。

2024-05-26 14:37:55 282

原创 ROS通信，如何查看话题的数据类型和传输自定义数据类型

test是我src工作空间下的功能包如下图，我想传输一个person类然后，我们需要在package.xml文件中添加依赖在cmakelist中添加如下依赖最后catkin_make 编译需要我们在代码中引用一下最终我们就可以实现自定义数据类型的通信。

2024-04-22 14:38:25 784 1

原创 behavior tree 介绍

从根节点开始按具体的顺序遍历执行，直到返回最终状态•叶节点（Execution Nodes）与底层代码结合起来，会执行具体的任务（action）或者检查（condition），返回 (success, failure, or running)•控制结点接受其子结点返回的状态，并决定下一个将展开哪个结点当只有一个目标点A但上述考虑是不完全的，我们在执行GoToA之前我们要先检测。例如当机器人已经到目的A时，就不需要再执行动作GoToA。直接FoundObj。

2024-03-10 19:48:19 1343 1

原创 lstm长短期神经网络

RNN让之前的信息保留下来，方便理解当前的token。后面LM主语是阿珍，遗忘之前的主语性别，更新新的主语性别。为细胞状态向量计算出一个0-1的值，用于衡量每一个信息需要记住多少，丢弃多少。丢弃旧的主语信息，添加新的主语信息。输入：上一时刻的细胞状态、隐藏状态ht-1、当前时刻的词嵌入向量xt。一个 LSTM 有三个这样的门，用于保护和控制细胞状态。遗忘门、输入门和新候选值向量、更新细胞状态、输出门。输出：当前时刻的两个隐藏状态ht和一个细胞状态。看到了阿珍的主语，所以需要输出的主语性别为女。

2023-12-26 15:01:08 617 4

原创 pycharm 配置pytorch虚拟环境

前面的字由base进入到pytorch。表示进入到pytorch虚拟环境。复制以下指令，粘贴到虚拟环境中安装。一路y或者enter，就可以啦！下载anaconda。打开anaconda prompt。找到适合自己电脑的版本。

2023-10-23 20:20:32 3276 2

原创解决tensorboard可视化浏览器网页无法打开

解决tensorboard可视化浏览器网页无法打开

2023-10-08 17:03:04 1250

sunsundayZ的博客