又见PTX，烤机神器Jetson GPU Burn实测

LitchiCheng

已于 2025-03-31 23:50:52 修改

阅读量202

点赞数 8

分类专栏： jetson linux 文章标签： java 开发语言人工智能机器人

于 2025-03-31 23:50:32 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38428827/article/details/146889634

版权

jetson 同时被 2 个专栏收录

13 篇文章

订阅专栏

12 篇文章

订阅专栏

视频讲解：又见PTX，烤机神器Jetson GPU Burn实测_哔哩哔哩_bilibili

又见PTX，烤机神器Jetson GPU Burn实测

jetson核心板测试gpu的应用程序需要考虑多程序占用gpu时的影响及gpu满负荷时温度的变化，影响着硬件、功耗、散热设计，如下为gpu的一个烤机程序

git clone https://github.com/anseeto/jetson-gpu-burn.git
cd jetson-gpu-burn
make -j6
./script.sh

烤机脚本如下，使用stress压测8核，使用gpu_burn 跑满 gpu

xterm -e stress --cpu 8 &
xterm -e ./gpu_burn 100000 &
tegrastats

compare.cu

CUDA是NVIDIA提供的高级GPU编程框架，通过扩展C/C++语法实现并行计算。它抽象了硬件细节（如线程调度、内存模型），允许开发者专注于算法逻辑

extern "C" __global__ void compare(float *C, int *faultyElems, size_t iters) {
    size_t iterStep = blockDim.x*blockDim.y*gridDim.x*gridDim.y;
    size_t myIndex = (blockIdx.y*blockDim.y + threadIdx.y)* // Y
        gridDim.x*blockDim.x + // W
        blockIdx.x*blockDim.x + threadIdx.x; // X

    int myFaulty = 0;
    for (size_t i = 1; i < iters; ++i)
        if (fabsf(C[myIndex] - C[myIndex + i*iterStep]) > EPSILON)
            myFaulty++;

    atomicAdd(faultyElems, myFaulty);
}

compare.ptx

PTX（Parallel Thread Execution）是NVIDIA设计的中间指令集，介于CUDA代码与GPU机器码（SASS）之间，类似于虚拟汇编语言。它提供硬件无关性，支持跨代GPU兼容，但需要依赖驱动程序即时编译（JIT）为具体架构的二进制代码，相较于CUDA的抽象层，PTX允许开发者直接操作底层硬件资源。

博客等级

码龄8年

152
原创

846
点赞

906
收藏

486
粉丝

关注

私信

热门文章

分类专栏

最新评论

MuJoCo + OMPL 进行Panda机械臂关节空间的RRT路径规划
weixin_44565625: AttributeError: 'Test' object has no attribute 'index' # 在 run_loop 之前调用 runBefor test.runBefor()
又见PTX，烤机神器Jetson GPU Burn实测
gcff1235: 为啥跑几十秒钟后GPU负载就没有了呢04-23-2025 10:28:25 RAM 12002/15522MB (lfb 619x4MB) SWAP 0/7761MB (cached 0MB) CPU [100%@1420,100%@1420,100%@1420,100%@1420,100%@1984,100%@1984,100%@1984,100%@1984] EMC_FREQ 0% GR3D_FREQ 99%@[0] CV0@55.312C CPU@56.906C SOC2@55.468C SOC0@52.906C CV1@53.625C GPU@55.5C tj@56.906C SOC1@53C CV2@52.187C 04-23-2025 10:28:26 RAM 12002/15522MB (lfb 619x4MB) SWAP 0/7761MB (cached 0MB) CPU [100%@1420,100%@1420,100%@1420,100%@1420,100%@1984,100%@1984,100%@1984,100%@1984] EMC_FREQ 0% GR3D_FREQ 99%@[0] CV0@55.375C CPU@57.218C SOC2@55.437C SOC0@53.031C CV1@53.562C GPU@55.312C tj@57.218C SOC1@53C CV2@52.25C 04-23-2025 10:28:27 RAM 12002/15522MB (lfb 619x4MB) SWAP 0/7761MB (cached 0MB) CPU [100%@1420,100%@1420,100%@1420,100%@1420,100%@1984,100%@1984,100%@1984,100%@1984] EMC_FREQ 0% GR3D_FREQ 99%@[0] CV0@55.312C CPU@57.187C SOC2@55.468C SOC0@52.937C CV1@53.593C GPU@55.531C tj@57.187C SOC1@52.968C CV2@52.25C 04-23-2025 10:28:28 RAM 12002/15522MB (lfb 619x4MB) SWAP 0/7761MB (cached 0MB)
Panda换成SO-Arm100机械臂，代码仅换一行，末端固定位姿一样控制
Jzzzzzzzzzzzzzz: ros2 launch so_arm100_moveit demo.lanuch.py 命令写错了哥后面的launch打错字母了
【逆解机械臂】Pinocchio+MuJuCo 仿真 CLIK 闭环控制！附代码
LitchiCheng: 这个是其他仓库github上搜一下
【逆解机械臂】Pinocchio+MuJuCo 仿真 CLIK 闭环控制！附代码
2401_84874652: 你好,franka_panda_description打开是空的?

最新文章

2025

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。