- 博客(23)
- 收藏
- 关注
原创 PRIMAL2训练环境
在配备 i9-10980XE CPU(18 核、36 线程)和 1 个 NVIDIA Titan RTX GPU 的单个工作站上进行训练的。该代码采用 9 个远程训练节点,其中 4 个通过 ODrM* 的模仿学习计算梯度,而另外 5 个使用最新策略运行纯 RL 训练。这些数字的选择是通过实验进行的,以保持 RL 与 IL 发作的比率接近 50%。
2024-03-20 19:39:51
145
原创 PRIMAL论文阅读
PRIMAL: Pathfinding via Reinforcement and Imitation Multi-Agent Learning论文阅读
2024-03-16 16:10:11
917
1
原创 Subdimensional Expansion for Multirobot Path Planning论文阅读
Subdimensional expansion for multirobot path planning
2024-03-16 15:59:20
778
2
原创 OpenGL报错与重装显卡驱动
错误提示pyglet.gl.ContextException: Could not create GL context。
2024-03-07 18:49:13
873
原创 模拟消息循环系统Version1
下面是模拟消息循环程序的第一个版本,使用C++编写。用户可以输入特定的命令(如"QUIT"、“CREATE”、“PAINT”),程序会根据这些命令执行相应的操作。如果用户输入的命令不在预定义的命令列表中,程序会将其视为其他类型的消息并处理。
2023-12-11 17:39:51
37
原创 Windows消息循环
系统定义的消息系统向应用程序通信时,系统会send或post系统定义的消息。系统通过这些消息控制应用程序的操作,并提供输入或者其他信息给应用程序。应用程序也可以使用这些消息来控制通过使用预先注册(register)的窗口类创建的控件窗口(control window)的操作应用程序定义的消息如果应用程序创建自己的消息,那么接收这些消息的窗口必须解释这些消息并提供适当的处理。
2023-11-13 20:58:38
58
原创 Knowledge Hypergraphs: Prediction Beyond Binary Relations[IJCAI-2020]
阅读Knowledge Hypergraphs: Prediction Beyond Binary Relations的笔记
2022-11-26 11:06:13
420
原创 操作系统概述
现代操作系统由CPU,Memory,I/O设备等构成1.操作系统概念2. CPU:从内存中提取指令并执行2.2 CPU的组成部件2.3.组织形式2.4.CPU的两种模式3.内存3.1 缓存3.1.1缓存系统需要解决的问题3.1.2两种缓存3.2 主存3.3虚拟内存4.进程4.1 进程4.1.1 概念4.1.2 地址空间4.1.3 线程5. I/O设备5.1设备控制器5.1.1 设备驱动程序5.2 实现输入和输出的方式5.2.1 忙等待(busy waiting)5.2.2 中断5.2.3 DMA1.操作系
2020-06-12 14:00:07
100
原创 Python基础
1./是浮点数除法,//是整数除法(eg.1/2=0.5;1//2=0)2.幂运算符**(eg.2**3=8)3.Python可以处理长整型数,自动转换,且可以和普通整数混合使用,长整型数后面加L4.十六进制(eg.0xAF)八进制(eg.010)5.使用变量之前要对其赋值6.模块 floor函数向下取整<<<import math<<<mat...
2020-03-04 20:43:42
67
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人