- 博客(48)
- 收藏
- 关注
原创 Sapien - No module named ‘pkg_resources‘
解决了阻塞,sapien==3.0.0b1 已经能 import。使用deprecated。
2026-05-09 02:02:18
204
原创 git创建new branch
cd /path/to/your/repogit statusgit checkout -b new_branchgit switch -c new_branchgit add .git commit -m “feat: add initial changes on new_branch”git push -u origin new_branch
2026-04-13 16:56:10
201
原创 [bug] unsupported GNU version! gcc versions later than 12 are not supported!
你的 nvcc 12.1 正在调用一个 GCC 13+ 的主机编译器,而 CUDA 12.1 默认只支持到 GCC 12。如果显示 13 或更高,就和报错一致。
2026-04-08 22:01:40
189
原创 cursor 无法连接计算节点debug怎么办
然后重新尝试ssh host_compute,就可以在计算节点上直接debug了。注意host_compute下的。保持一致(都要写同样的。
2026-03-15 15:43:01
56
原创 Cursor debug 调试栏不见了怎么解决(toolbar missing)
苦哈哈用F10来continue, 但是实在不习惯。原来他叫“Debug Toolbar", 想让他重现的话需要把设置里的。就能看到调试栏重新回到左上角了,但是不能像以前一样浮动显示。一觉醒来天塌了,debug找不到“下一步“了。就是下面这玩意⬇️ 直接消失了。
2026-03-13 20:27:36
103
原创 undefined symbol: _ZN3c105ErrorC2ENS_14SourceLocationENSt7
问题在flash-attn的版本,大于2.8.0的版本会显示undefined symbol,降到更低的版本例如。
2025-11-19 16:32:20
417
原创 Closed-Loop Evaluation in Robotics: A Practical Template (for openvla + LIBERO)
4)将动作送回仿真器执行;标准闭环评估系统通常采用双环境解耦设计:一个环境运行策略模型(通常依赖 PyTorch、CUDA 等深度学习库),另一个环境运行仿真器(依赖 robosuite、MuJoCo 等物理引擎)。在机器人学习,特别是视觉-语言-动作(VLA)模型的开发中,closed-loop evaluation(闭环评估)是验证策略在动态环境中实际能力的关键环节。综上,一个健壮的闭环评估不仅验证模型能力,也揭示数据、模型、仿真三者之间的鸿沟,是推动策略从“模仿”走向“鲁棒控制”的必要环节。
2025-11-13 22:58:48
374
原创 ERROR: Failed building wheel for egl_probe
please check your cmake version.I can install egl_probe with cmake==3.24.3
2025-11-10 22:57:26
599
原创 QA about Flow Matching Objective
The Standard Flow Matching: “pred_vel” ObjectiveIn the standard Flow Matching framework with a straight-line path zt=(1−t)z0+tx1zt=(1−t)z0+tx1zt=(1−t)z0+tx1:The “pred_data” Objective (Predicting x1 directly)Let’s consider an alternative where you
2025-07-31 16:50:50
809
原创 Flow Model & Flow Matching
Concept:A “flow model,” more precisely known as a Normalizing Flow (NF), is a type of generative model that explicitly learns a probability distribution by transforming a simple, known distribution (e.g., a standard Gaussian) into a complex, target data d
2025-07-30 23:56:37
860
原创 [Bug | Cursor] import error: No module named ‘data‘
【代码】[Bug | Cursor] import error: No module named ‘data‘
2025-07-23 21:29:00
308
原创 [RFT] Why GRPO feels weird / “saddle-point“ intuition
PPO和GRPO是两种强化学习优化方法。PPO通过最大化期望奖励改进策略,使用重要性采样和裁剪机制确保稳定性,依赖标量奖励信号。GRPO则基于偏好学习,通过排名反馈优化策略,鼓励高排名样本并抑制低排名样本,但可能面临鞍点问题和信号扁平化风险。PPO更稳定但易受噪声奖励影响,GRPO依赖排名质量且缺乏明确的优势评估。两种方法在反馈类型、损失函数和稳定性方面存在显著差异。
2025-07-11 15:25:06
604
原创 [RL迷思] Supervised Learning vs. RL(Instructing the Model via Rewards)
【代码】[RL迷思] Supervised Learning vs. RL(Instructing the Model via Rewards)
2025-07-11 15:17:12
859
原创 [bug] Failed to build installable wheels for some pyproject.toml based projects (cython_bbox)
【代码】[bug] Failed to build installable wheels for some pyproject.toml based projects (cython_bbox)
2025-07-06 13:49:06
415
原创 accidentally did git add . and staged/committed a huge file
【代码】accidentally did git add . and staged a huge file。
2025-04-14 17:05:19
415
原创 [vscode] 取消点击文件目录自动跳转
vscode只要打开某个文件,目录就会自动跳转到文件的位置,有时候文件太多了总是跳来跳去的,影响找文件,还容易发晕(是的我的小脑打不了一点射击游戏)
2025-04-02 16:30:52
1556
1
原创 [vscode] LD_LIBRARY_PATH vs. VSCode environment mismatch
【代码】[vscode] LD_LIBRARY_PATH vs. VSCode environment mismatch。
2025-03-30 13:11:36
446
原创 [python] No matching distribution found for yaml
【代码】[python] No matching distribution found for yaml。
2025-03-30 12:38:49
496
原创 [VScode | extension] ❌ no space left on device
【代码】[VScode | extension] ❌ no space left on device。
2025-03-25 11:20:41
794
原创 Ubuntu terminus 多窗口分屏tmux
在远程登陆Linux时,要远程启动多个程序,分屏显得很重要。在这里小记一下几种简单的分屏命令。1、terminal分屏。
2025-03-20 23:24:36
785
原创 [linux] Why Ctrl+C Doesn’t Fully Stop ProcessPoolExecutor?
【代码】[linux] Why Ctrl+C Doesn’t Fully Stop ProcessPoolExecutor?
2025-03-17 14:30:19
570
原创 [Bug|Zed] No module named ‘pyzed.sl‘
pytorch whl download: https://download.pytorch.org/whl/cu118
2024-08-21 15:31:49
1365
原创 [cu118] 资源列表
pytorch whl download: https://download.pytorch.org/whl/cu118
2024-08-20 22:27:13
234
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅