诺贝尔不想讲-CSDN博客

如果版本早于0.26，那么它将创建一个`SuperMarioBros-1-1-v0`的游戏环境，并不指定渲染模式，因为在0.26之前的版本中，默认就有渲染功能。4. 使用`env.step(action=0)`进行一步游戏，其中`action=0`意味着执行“向右走”的动作。然后，它从环境中获取下一个状态（`next_state`）、奖励值（`reward`）、是否完成游戏（`done`）以及额外的信息（`info`）。3. 通过调用`env.reset()`重置环境，准备开始新的游戏。

2024-07-17 15:12:17 856

原创工具 -- Valgrind

【代码】工具 -- Valgrind。

2024-07-15 13:23:46 169

原创 [强化学习马里奥 MarioRL]--Q值和V值 2

在强化学习（RL）中，Q值和V值是两种用于评估状态和行动的价值指标，它们对于决策过程至关重要。以下是关于Q值和VQ。

2024-07-15 12:56:07 447

原创 Apollo 开源自动驾驶平台

后面发布apollo相关文档。

2024-07-15 12:04:24 231

原创 [神经网络]--手写数字识别

对于灰度图像（范围[0, 1]），将它们减去0.5然后除以0.5（实际上这相当于将范围从[0, 1]转换到[-1, 1]），但这种处理方式不严格符合传统的均值为0、标准差为1的标准化定义，因为这里的均值和标准差是人为设定的，而不是根据数据集的统计特性计算得出的。输出结果将显示训练集和测试集的大小，对于MNIST数据集，训练集通常包含60000张图片，测试集包含10000张图片。：这个转换会对Tensor进行标准化处理，使其均值为0，标准差为1。），并指定了每个批次（batch）的大小为64。

2024-07-12 20:13:39 771

原创 [强化学习马里奥 MarioRL]--环境安装 1

建议使用conda环境进行包管理 torch gym包默认安装好了。测试包代码执行后看有没有报错缺啥装啥。

2024-07-12 13:35:59 206

原创 [强化学习马里奥 MarioRL]--参考

torch官方文档github代码：

2024-07-12 13:28:33 454

qhr_1012的博客

原创 VSomeip库- 编译&&使用

原创 [ Pytorch教程 ] 1、DataSet类

原创 [ Pytorch教程 ] 0、环境安装

原创 [ZMQ] -- ZMQ通信收发多个Proto数据结构 2

原创 [ZMQ] -- ZMQ通信&&Protobuf数据结构 1

原创 ROS2 常用工具之Launch -- 启动管理工具

原创 ROS2 通信三大件之动作 -- Action

原创 ROS2 “通信方式” 参数服务器

原创 ROS2 通信三大件之《服务》-- Service

原创 ROS2 如何实现自定义Msg数据结构

原创 ROS2 通信三大件之《话题》

原创 ubuntu22.04 ROS2 - 安装

转载 CICD gitlab-ci文件解析

原创 Ubuntu22.04阿里云服务器 Gitlab搭建CICD

原创 [自动驾驶] -- 卡尔曼滤波

原创 Apollo -- Planning (五) 参考线 ReferenceLineProvider

原创工具 -- Eigen

原创 Apollo -- Planning (四) 交通决策器 TrafficDecider

原创 [强化学习]-- highway_env 自动驾驶仿真

原创 Apollo -- Planning (三) Plan节点主流程

原创 [神经网络] -- 学习参考文章

原创 Apollo -- Planning (二) 框架设计

原创 [强化学习]--悬崖漫步

原创 Apollo -- Planning (一) 模块启动相关

原创 [强化学习马里奥 MarioRL]-- 智能体 Agent 4

原创 [强化学习马里奥 MarioRL]-- 环境ENV 3