- 博客(9)
- 收藏
- 关注
原创 AlphaGo zero 的部分原理理解
有利的动作产生的下一刻状态可能有较高的V,但这个V是均值(暂时这么理解),也就是说,较高的V的下一层中可能有较低的V, 较低的V的下一层中也可能有更高的V。所以,采用MCTS进行更深层的探索,有可能找到潜在的更优解。输出应该是有好多动作的概率以及当前的V;
2023-10-23 21:01:13 71
原创 mlagent 追逃 训练记录
比如 act[0-3]的增量设置为0.015时,可以看到每隔0.02(默认步长),速度在三个轴向分别增加0.015.ForceMode.VelocityChange 是每步长速度的变化量。
2023-08-05 23:59:34 121 1
原创 AlphaZero环境部署报错: `find_package_handle_standard_args` (CUDNN) does not match (Caffe2).
其中的路径就是, 所以打印出的路径,放进CmakeLists.txt中的上述代码中就可以了解决报错了。
2023-07-18 11:30:29 309 1
原创 Ubuntu 停留在虚拟终端不能回到图形界面(Ctrl+Alt+F7 is not working)的解决办法
应该是不小心卸载了lightdm这个package,然后在虚拟终端按Ctrl+Alt+F7 is not working, 但是Ctrl+Alt+[F1-F6] works perfectly。在tty1到tty6的虚拟终端里运行。reboot 进入Ubuntu高级选项,选择recovery mode。重新启动计算机回到Ubuntu的图形界面了。
2023-05-27 22:38:34 1224
原创 Ubuntu安装以及运行mlagents/gridsensor教程
其中,插件com.unity.ml-agents以及com.unity.ml-agents.extensions,是通过本地导入的(unity3D工具栏window,选择package manager, 选择解压包release_18_branch中对应的插件)。安装的是mlagents release_18_branch(因为是gridsensor 2.0要求对应的一个版本 ), pip安装时对应的是0.27.0。然后运行unity3D对应的例子即可开始训练。
2023-03-26 21:41:53 299
原创 在pt文件转换为onnx过程中:TypeError: forward() missing 2 required positional argument
在pt文件转换为onnx过程中:TypeError: forward() missing 2 required positional argument
2023-02-13 18:20:14 1425 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人