2024年10月_Eternal-Student

原创 SM单元硬件

每个SM包含多个流处理器（cores）或线程（threads），例如Nvidia H100 GPU有132个SM，每个SM有64个cores，总共有8448个cores。此外，SM上的控制单元资源也由所有cores共享，每个SM还配备了用于执行线程的硬件调度器。SM还具有一些功能单元或其他加速计算单元，例如张量核心或光线追踪单元，以满足GPU所处理的工作负载的特定计算需求。简而言之，SM是GPU中用于执行并行计算任务的基本单元，它包含了多个处理核心、共享内存、控制单元和其他加速计算单元。

2024-10-30 16:18:00 623

原创【cudnn install】windows

参考：）解压之后。

2024-10-25 23:46:10 271

原创【CUDA Toolkit install】windows

对于windows的，下载后相应的文件（cuda_12.4.0_551.61_windows.exe），双击之后，按照提示一个一个安装就好了，选择安装什么时候，只选第一个CUDA，其余不安装也是可以的，其余之后就可以运行，注意cuda安装位置要默认C盘就好,方便。选择对应选项（这是最新的，旧版的在下面）

2024-10-25 23:43:47 859

原创 TensorRt OP

TensorRT在构建网络时，会将模型中的层（Layers）转换为这些OP的组合，然后通过算子融合（Operator Fusion）等技术优化这些OP的执行，以提高整体的推理性能。此外，TensorRT还支持自定义OP，这允许开发者将特定的、TensorRT中未内置的操作集成到推理引擎中，这在处理一些特殊的深度学习模型时非常有用。在TensorRT中，OP（Operations，操作）是指网络中的基本计算单元，类似于数学中的运算符。每个OP执行一个特定的计算任务，例如卷积、矩阵乘法、激活函数等。

2024-10-25 10:28:35 215

原创【个性化软件汇总】

ClickShow：一款给鼠标点击加上特效的小工具–win开源地址：https://github.com/cuiliang/ClickShow相应介绍：https://zhuanlan.zhihu.com/p/625500809

2024-10-23 23:43:05 116

原创 TensorRT构建的engine文件用途

1. 加速推理：通过优化模型的计算图和使用高效的算子实现，TensorRT engine可以显著提高模型推理的速度。2. 降低延迟：对于需要实时响应的应用，如自动驾驶和视频分析，TensorRT engine可以减少推理过程中的延迟。10. 精度校准：TensorRT提供了精度校准工具，可以在保持推理速度的同时，对模型的精度进行优化。总的来说，TensorRT engine是实现深度学习模型在NVIDIA硬件上高效推理的关键组件，它通过一系列的优化技术，使得模型在实际应用中能够快速、准确地运行。

2024-10-23 12:18:38 603

原创 NVIDIA Jetson支持的神经网络加速的量化平台

PPQ通过支持这些不同的硬件后端平台，使得开发者可以在多种硬件上进行模型的量化和部署，从而实现跨平台的模型优化和推理加速。PPQ的这种灵活性和可扩展性，使其成为一个强大的工具，可以帮助开发者在不同的硬件平台上实现高效的AI模型部署。：由商汤 HPC 团队开发的量化框架 PPQ，支持多个硬件后端平台的量化模拟与部署，并在此基础上抽象出一套完整的量化框架设计。使用这些工具和平台，开发者可以在 Jetson 设备上进行神经网络的量化模拟、训练、优化和部署，以实现高效的深度学习推理。

2024-10-21 21:48:31 1128

原创【Quantize ONNX models】

Quantize ONNX models | onnxruntime

2024-10-21 20:38:21 191

原创【ppq install】

首先，确保系统已经安装了 CUDA Toolkit。可以从 NVIDIA 官网下载并安装适合操作系统和 GPU 的 CUDA 版本。：更新或安装 PyTorch 到 1.10 或更高版本，因为。还可以从 PyPI 安装 PPQ：（yes）版本过高，可以尝试安装特定版本的。需要 PyTorch 支持。虽然可以，我选择从源码安装的，如果遇到任何依赖问题，比如。(果然遇到了这个问题)

2024-10-21 20:34:18 421

原创【python error】Descriptors cannot be created directly. must be regenerated with protoc ＞= 3.19.

这是由于版本过高引起的,所以要降低版本。

2024-10-21 20:16:56 317

原创【Visual Studio 2019 C++ 编译器的路径添加到系统 PATH 环境变量】

对于某些 Python 包，特别是那些涉及本地扩展或需要编译 C/C++ 代码的包，需要一个支持 C++ 开发的环境。Visual Studio 是一个全面的开发环境，它提供了编译器、调试器以及其他许多工具，这些工具对于开发和编译 C++ 代码非常有用。

2024-10-21 15:31:32 4005

原创【环境变量】windons的Path

在 Windows 操作系统中，“Path” 是一个重要的环境变量，它定义了操作系统在执行命令时搜索可执行文件的目录。简而言之，当你在命令行（例如 cmd 或 PowerShell）中输入一个命令时，Windows 会查看 “Path” 环境变量中列出的目录，以查找对应的可执行文件。

2024-10-21 12:27:20 757

原创【tensorrt install 】

无需点击download的下载界面，直接可选TensorRT Download | NVIDIA Developer下载的是 tar type （推荐）：- TensorRT 10.5 GA for Linux x86_64 and CUDA 12.0 to 12.6 TAR Package下载的是deb type： TensorRT 10.5 GA for Ubuntu 20.04 and CUDA 12.0 to 12.6 DEB local repo Package查看安装前准备环境：出现这个错

2024-10-20 20:39:21 1056

原创【安装cudnn】

如果打算使用深度学习框架，如TensorFlow或PyTorch，并且需要GPU加速，可能还需要安装NVIDIA的cuDNN库，它是一个GPU加速的深度神经网络库。这些信息表明cuDNN库已经安装在系统中，并且可以使用它来加速深度学习框架中的神经网络运算。包安装cuDNN是一个更加自动化和集成的过程，它会自动处理文件的复制和权限设置。包与你的系统和CUDA版本兼容，通常不需要手动干预文件的复制过程。命令会处理包的安装，包括文件的复制和依赖关系的解决。如果还需要开发相关的包，比如库的头文件，可以安装。

2024-10-20 20:31:54 1572

原创【安装CUDA Toolkit】

CUDA Driver是运行CUDA应用程序所必需的，它提供了CUDA Toolkit与GPU硬件之间的接口。系统中已经安装了CUDA 10.1版本的编译工具（nvcc），这是NVIDIA CUDA Toolkit的一部分。请确保在安装驱动程序之前，系统已经禁用了Nouveau驱动，这是开源的NVIDIA驱动程序，它可能会与官方驱动程序冲突。不知道有没有用，应该没用，对于12.x使用cuda刚好，因为在没有降级之前就已经安装好了cuda12.3;你需要运行相同的安装脚本来安装驱动程序。

2024-10-20 20:20:42 1256

原创【安装nvidia显卡驱动】

请注意，如果你的系统中有多个版本的NVIDIA驱动程序，确保在安装新驱动之前完全移除旧的驱动程序，以避免潜在的冲突。这样做的目的是确保在重启X服务器后，系统会使用NVIDIA的X驱动程序。如果你看到这样的提示，意味着驱动程序安装程序已经准备好修改你的X服务器配置文件（通常是。在安装过程中，你可能会看到一些提示，根据提示进行操作。通常，你可以选择“agree”接受许可协议，然后选择“install”进行安装。在安装NVIDIA驱动程序的过程中，系统可能会询问你是否希望运行。重启你的系统以应用更改。

2024-10-20 19:04:17 992

原创【显卡驱动黑屏】联想Y9000安装nvidia显卡driver开机黑屏幕

开机按F2进入Bios开机界面，选择“UEFI Firmware Setting“, 进入如下界面。在BIOS中找到“Configuration”菜单，然后选择“Graphic Device”设置。“Switchable Graphics”（混合模式）/ Dynamics Graphics。问题：安装显卡驱动后开机黑屏 “_”（开机之后，整个屏幕首行出现"__"）“Discrete Graphic”（独显直连模式）电脑型号：联想拯救者Y9000。系统：ubuntu20.04。显卡：RTX4060。

2024-10-20 18:47:05 1419

原创【linux】GCC 7和GCC 8版本不再包含在默认的软件仓库中

请注意，添加旧版本的软件仓库可能会让系统暴露在安全风险中，因为旧版本的软件包可能不会接收到安全更新。因此，只有在确实需要旧版本的GCC时才推荐这样做，并且在完成工作后，最好移除旧的软件仓库以避免将来的依赖问题。不过，你可以通过添加Ubuntu 20.04（Focal Fossa）的软件仓库到系统来安装这些较旧的GCC版本，因为GCC 7和GCC 8在Ubuntu 20.04的仓库中仍然可用。由于GCC 7和GCC 8版本不再包含在默认的软件仓库中，你不能直接通过。置默认的GCC版本，可以使用。

2024-10-19 22:55:56 550

原创多个版本的GCC（GNU编译器集合）可以同时安装并存

在Ubuntu系统中，多个版本的GCC（GNU编译器集合）可以同时安装并存。GCC是编译C、C++以及其他编程语言程序的重要工具，不同的项目可能需要不同版本的GCC来确保兼容性。

2024-10-19 19:39:09 776

原创【python error】cannot import name ‘TorchDispatchMode‘ from ‘torch.utils._python_dispatch‘

报错：cannot import name ‘TorchDispatchMode’ from ‘torch.utils._python_dispatch’ (/home/nvidia/.conda/envs/pytorch/lib/python3.8/site-packages/torch/utils/_python_dispatch.py)File “/media/nvidia/Ubuntu/xxxxx/evalue.py”, line 24, in from ptflops import get

2024-10-18 21:07:38 1863 1

原创【python error】/lib/aarch64-linux-gnu/libstdc++.so.6: version `GLIBCXX_3.4.29‘ not found

在jeston中运行代码遇到以下问题：系统中安装的库版本过旧，不满足scipy库中某个组件（这里是）所需的版本。这通常发生在使用了较新版本的编译器编译的 Python 库，但是系统上的 C++ 标准库版本较旧的情况下。

2024-10-18 21:02:16 1088

原创【python error】site-packages/sklearn/__check_build/../../scikit_learn.libs/libgomp-d22c30c5.so.1.0.0

（在使用Jetson平台时遇到的libgomp静态TLS块内存分配问题，提供了解决方案，即通过LD_PRELOAD环境变量加载libgomp库。只需修改~/.bashrc并重启终端，即可避免该问题。

2024-10-18 20:57:05 253

原创【windows个性化】在 Windows 10/11 上使 Windows 任务栏半透明/透明

实现目的：在 Windows 10/11 上使 Windows 任务栏半透明/透明.

2024-10-17 11:41:46 542

原创【Ubuntu】/usr/src目录

这个目录是Linux文件系统层次结构的一部分，它遵循Filesystem Hierarchy Standard (FHS)，这是Linux系统中文件和目录组织的一个标准。目录传统上用于存放源代码，但在现代Linux发行版中，许多软件包都是通过包管理器（如APT、YUM或DNF）安装的，这些包管理器会自动处理源代码的下载、编译和安装。这个目录通常用于存放软件的源代码文件，尤其是在你从源代码编译安装软件时。目录下应用补丁到软件的源代码中，以修复bug或添加新功能。目录下编译软件，这样可以将编译后的程序安装到。

2024-10-17 11:38:29 717

原创【Linux】/usr/share目录

目录的设计目的是将这些共享资源与用户的个人文件和系统配置文件分开，这样可以更容易地管理和维护系统。由于这些文件通常是只读的，并且被多个用户和程序共享，因此它们通常放置在非用户可写的目录中，以防止被意外修改或删除。这个目录遵循Filesystem Hierarchy Standard (FHS)，它定义了Linux系统中文件和目录的组织结构。下的某些目录中可能包含配置文件的默认或示例模板，这些模板可以在首次安装软件时复制到用户的主目录或。：程序运行时需要的静态数据文件，如字典文件、游戏数据文件等。

2024-10-17 11:38:07 1237

原创【tensorrt】加速理论知识

TensorRT是 NVIDIA 提供的一款专为深度学习推理设计的高性能优化工具。优化深度学习模型：通过图优化、层融合、内核自动调优等技术，提升模型的推理性能。支持多种精度：包括 FP32、FP16 和 INT8，用户可以根据需求选择合适的精度，以在性能和精度之间取得平衡。兼容多种框架：支持从 TensorFlow、PyTorch、ONNX 等多种深度学习框架导出的模型。部署灵活：适用于服务器端、边缘设备和嵌入式设备，支持多种平台和硬件配置。TensorRT。

2024-10-16 01:14:13 1877

原创使用SSH进行GitHub的推送

使用SSH进行GitHub的推送是一种安全且便捷的方法。

2024-10-16 00:50:52 1147

原创【jeston】torch相关环境安装

离线下载网址：https://download.pytorch.org/whl/torch_stable.html。但是我的版本是对的，但是只是个警告 ignore it。

2024-10-15 19:14:12 601 1

原创【python 函数】f = open(‘example.txt‘, ‘r‘)

语句仍然是更推荐的方式，因为它更简洁，且自动处理文件关闭，减少了出错的可能性。方法，即使在发生异常的情况下也是如此。为了确保文件总是被关闭，可以使用。块中的代码都会执行，这确保了文件会被关闭。这是一个基本的文件操作示例，不使用。语句，需要手动打开文件，并在完成文件操作后，使用。代码块时，Python会自动为你关闭文件。函数打开一个文件，然后读取其内容，最后使用。在Python中，处理文件时通常推荐使用。语句时，不需要显式地关闭文件，因为退出。结构中，无论是否发生异常，需要注意的是，如果不使用。

2024-10-15 16:46:28 246

原创【linux个性化】dock图标居中

指的是将整个dock横条或者竖条扩展到适应屏幕尺寸一样长或者高，关闭他之后就可以居中了，意思是不扩展了，我的图标多大，就显示多大，在中央开始显示。打开「Dconf 编辑器」，依次展开 org > gnome > shell > extensions > dash-to-dock。：在鼠标不滑动的时候是隐身的，相当于windows系统的图标隐藏；: 图标位置，分为top，bottom,left，right；使用 Dconf 编辑器。3. 通过设置相关按键。

2024-10-15 10:16:16 506

原创【linux】Microsoft Edge 的 Bookmarks 文件存储位置

在 Linux 系统中，Microsoft Edge 的书签（Bookmarks）文件存储在用户的配置目录下。如果你在查找过程中遇到问题，可以确保 Edge 已正确安装，并且你有相应的访问权限访问这些隐藏文件夹。

2024-10-15 09:54:59 1610

原创【python】@staticmethod装饰器

是一个装饰器，用于定义一个静态方法。静态方法是一种不依赖于类或实例的数据的类方法。它不会自动接收类（cls）或实例（self）作为第一个参数，因此不能访问类的状态或实例的状态。静态方法通常用于实现与类相关的功能，但不需要访问类或实例的任何属性。它们可以被看作是类中的普通函数，但可以通过类名直接访问，而不需要创建类的实例。静态方法通常用于工具类或者辅助函数，它们不依赖于类的状态，只是提供了一些通用的功能。都是静态方法，它们可以通过类名直接调用，而不需要创建。

2024-10-14 16:40:55 328

原创【python 语法】内置装饰器-@property

property是 Python 面向对象编程中一个非常有用的工具，它通过装饰器机制，提供了一种优雅的方式来管理类的属性访问和修改，增强了代码的封装性和可维护性。

2024-10-13 12:23:57 556

原创元组（tuple）转换为列表（list）

将(x, y)形式的元组转换为[x, y]形式的列表在Python中非常简单，可以使用list()函数或列表推导式完成。具体转换方法取决于数据的结构和您的需求。单个元组：使用或。多个元组组成的列表：使用列表推导式或。嵌套元组：使用递归函数逐层转换。

2024-10-12 14:53:22 2959

原创 [vx, vy, x0, y0] = cv2.fitLine(contour, cv2.DIST_L2, 0, 0.01, 0.01)

接下来的参数（0, 0.01, 0.01）是算法的特定参数，它们分别指定了拟合直线的方法（这里是 0，表示使用所有点进行最小二乘拟合）、拟合直线时考虑的点到直线的最大距离（这里是 0.01，用于剔除远离大多数点的噪声点）、以及算法迭代的终止条件（这里也是 0.01，但具体含义取决于使用的拟合方法，对于 0 方法，它可能不被直接使用）。如果 vx 接近 0，那么直线几乎是垂直的，斜率将是无穷大或未定义的。这个点位于拟合的直线上，但不一定是轮廓上的点，也不一定是直线的中点或任何其他具有特殊意义的点。

2024-10-11 11:33:01 533

原创模型轻量化

蒸馏（Distillation）MMRazor是OpenMMLab的模型轻量化工具箱，旨在支持各类计算机视觉任务上模型轻量化算法的研究与应用。它整合了主流的模型轻量化算法，包括知识蒸馏（KD）、模型剪枝（Pruning）、模型量化（Quantization，目前正在开发中）和网络结构搜索（NAS）等。

2024-10-08 14:04:02 303

原创 everyday_question dq20240731

尽管"有线路由器"这个术语可能引起一些混淆，因为"路由器"通常指的是在不同网络之间转发数据包的设备，但在这里我们假设你指的是具有有线连接功能的路由器，即可以同时处理无线和有线网络连接的设备。CAN卡，即Controller Area Network（控制器局域网）接口卡，是一种特殊的网络接口卡，用于实现设备与CAN网络的连接。网卡（Network Interface Card，NIC），也称为网络适配器，是计算机硬件的一部分，用于实现计算机与网络之间的连接和数据传输。

2024-10-05 00:28:11 955

原创 conda.models.version:get_matcher(537) / 1.7.1.*

如果你想要添加多个频道，可以多次运行这个命令，或者使用逗号分隔的频道列表（但请注意，并不是所有版本的Conda都支持一次性添加多个频道）。文件中没有其他配置，这将导致Conda只使用其默认的官方源。然而，在某些情况下，这个命令可能不会按预期工作，特别是如果。这个选项允许你指定一个或多个频道，Conda将在这些频道中搜索你请求安装的包。命令，实际上，这个命令并不是直接用来移除特定的Conda频道的标准方法。总之，对于Conda频道的管理，建议使用。配置项，而不是只移除特定的频道。文件，只保留默认的频道设置。

2024-10-04 14:31:51 2327 1

原创指令集介绍

定义：指令集是CPU中所有指令的集合，这些指令规定了CPU能够执行的操作和功能。特点它是CPU能够“理解”的语言，用于指导CPU执行各种运算和操作。指令集通常包含操作码（opcode，指定操作类型）、寻址方式（address，指定操作数位置）和数据类型（data type，指定操作数类型）等信息。指令集的先进性和复杂性直接影响到CPU的效率和性能。

2024-10-04 13:54:43 1455

原创预处理、编译、汇编、链接

在编译过程中，预处理、编译和链接阶段虽然也涉及代码的转换和处理，但它们并不直接涉及指令集的使用。虽然预处理不直接考虑不同架构，但开发者在编写源代码时，通常会考虑到目标架构的特性，并在代码中做出相应的调整。然而，预处理的结果会直接影响到后续的编译过程，因为编译器需要根据预处理后的源代码来生成汇编代码。指令集是每种CPU特有的，定义了CPU可以执行的所有指令的集合，包括数据处理指令、跳转指令、内存访问指令等。综上所述，预处理过程不直接考虑不同架构的差异，但它为后续步骤针对不同架构的优化提供了必要的源代码基础。

2024-10-04 13:51:48 1679

空空如也

空空如也